📅  最后修改于: 2023-12-03 15:13:38.710000             🧑  作者: Mango
在使用 BeautifulSoup 进行网页解析时,字符串属性是最常用的属性之一。这些属性包括标签的名称,标签中的文本内容以及标签属性等。
标签的名称即为标签本身的名称,它可以通过 name
属性获取。下面是一个例子:
from bs4 import BeautifulSoup
html = '<html><head><title>BeautifulSoup中的字符串属性</title></head><body><p>这是一篇介绍 BeautifulSoup 字符串属性的文章。</p></body></html>'
soup = BeautifulSoup(html, 'html.parser')
title = soup.title
print(title.name) # 输出 title
标签中的文本内容可以通过 string
属性获取。下面是一个例子:
from bs4 import BeautifulSoup
html = '<html><head><title>BeautifulSoup中的字符串属性</title></head><body><p>这是一篇介绍 BeautifulSoup 字符串属性的文章。</p></body></html>'
soup = BeautifulSoup(html, 'html.parser')
p = soup.p
print(p.string) # 输出 这是一篇介绍 BeautifulSoup 字符串属性的文章。
标签的属性可以通过 attrs
属性获取,它会返回一个字典,其中包含了所有属性名称和对应的属性值。下面是一个例子:
from bs4 import BeautifulSoup
html = '<html><head><title>BeautifulSoup中的字符串属性</title></head><body><p class="intro">这是一篇介绍 BeautifulSoup 字符串属性的文章。</p></body></html>'
soup = BeautifulSoup(html, 'html.parser')
p = soup.p
print(p.attrs) # 输出 {'class': 'intro'}
我们也可以通过 get
方法获取特定属性的值,下面是一个例子:
from bs4 import BeautifulSoup
html = '<html><head><title>BeautifulSoup中的字符串属性</title></head><body><p class="intro">这是一篇介绍 BeautifulSoup 字符串属性的文章。</p></body></html>'
soup = BeautifulSoup(html, 'html.parser')
p = soup.p
print(p.get('class')) # 输出 ['intro']
以上就是 BeautifulSoup 中字符串属性的介绍,希望对大家有所帮助。