在Python中使用 Beautifulsoup 获取标签名称
先决条件: Beautifulsoup 安装
Name属性由 Beautiful Soup 提供,它是Python的网络抓取框架。网络抓取是使用自动化工具从网站中提取数据的过程,以加快过程。 Name 对象对应于原始文档中的 XML 或 HTML 标签的名称。
句法:
tag.name
参数:此函数不接受任何参数。
执行:
示例 1:提取 XML 标记名称的程序。
Python3
# Import module
from bs4 import BeautifulSoup
# Initialize the object with a XML
soup = BeautifulSoup('''
the first strong tag
''', "lxml")
# Get the tag
tag = soup.name_of_tag
# Get the tag name
name = tag.name
# Print the output
print(name)
Python3
# Import module
from bs4 import BeautifulSoup
# Initialize the object with a HTML page
soup = BeautifulSoup('''
Heading 1
Heading 2
''', "lxml")
# Get the whole h2 tag
tag = soup.h2
# Get the name of the tag
name = tag.name
# Print the output
print(name)
输出:
name_of_tag
示例 2:解释 HTML 标记的上述功能的程序。
蟒蛇3
# Import module
from bs4 import BeautifulSoup
# Initialize the object with a HTML page
soup = BeautifulSoup('''
Heading 1
Heading 2
''', "lxml")
# Get the whole h2 tag
tag = soup.h2
# Get the name of the tag
name = tag.name
# Print the output
print(name)
输出:
h2