📜  BeautifulSoup 中的字符串属性 – Python(1)

📅  最后修改于: 2023-12-03 15:13:38.710000             🧑  作者: Mango

BeautifulSoup 中的字符串属性 – Python

在使用 BeautifulSoup 进行网页解析时,字符串属性是最常用的属性之一。这些属性包括标签的名称,标签中的文本内容以及标签属性等。

标签的名称

标签的名称即为标签本身的名称,它可以通过 name 属性获取。下面是一个例子:

from bs4 import BeautifulSoup

html = '<html><head><title>BeautifulSoup中的字符串属性</title></head><body><p>这是一篇介绍 BeautifulSoup 字符串属性的文章。</p></body></html>'
soup = BeautifulSoup(html, 'html.parser')

title = soup.title
print(title.name)  # 输出 title
标签中的文本内容

标签中的文本内容可以通过 string 属性获取。下面是一个例子:

from bs4 import BeautifulSoup

html = '<html><head><title>BeautifulSoup中的字符串属性</title></head><body><p>这是一篇介绍 BeautifulSoup 字符串属性的文章。</p></body></html>'
soup = BeautifulSoup(html, 'html.parser')

p = soup.p
print(p.string)  # 输出 这是一篇介绍 BeautifulSoup 字符串属性的文章。
标签属性

标签的属性可以通过 attrs 属性获取,它会返回一个字典,其中包含了所有属性名称和对应的属性值。下面是一个例子:

from bs4 import BeautifulSoup

html = '<html><head><title>BeautifulSoup中的字符串属性</title></head><body><p class="intro">这是一篇介绍 BeautifulSoup 字符串属性的文章。</p></body></html>'
soup = BeautifulSoup(html, 'html.parser')

p = soup.p
print(p.attrs)  # 输出 {'class': 'intro'}

我们也可以通过 get 方法获取特定属性的值,下面是一个例子:

from bs4 import BeautifulSoup

html = '<html><head><title>BeautifulSoup中的字符串属性</title></head><body><p class="intro">这是一篇介绍 BeautifulSoup 字符串属性的文章。</p></body></html>'
soup = BeautifulSoup(html, 'html.parser')

p = soup.p
print(p.get('class'))  # 输出 ['intro']

以上就是 BeautifulSoup 中字符串属性的介绍,希望对大家有所帮助。