📅  最后修改于: 2023-12-03 14:59:30.849000             🧑  作者: Mango
在 Python 中解析 HTML 和 XML 文档是一项常见的任务,为此,我们可以使用 BeautifulSoup 库。BeautifulSoup 是一个 Python 的第三方库,可以从 HTML 或 XML 文件中提取数据,很容易易读和修改文档。
在命令行中输入以下命令来安装 Beautifulsoup:
pip install beautifulsoup4
从BeautifulSoup官方网站下载并解压源码包。
在命令行中进入解压后的源码包所在目录,在命令行中输入以下命令安装 Beautifulsoup:
python setup.py install
简单的使用方法:
from bs4 import BeautifulSoup
import requests
# 获取网页内容
r = requests.get('https://www.example.com/')
content = r.content
# 解析 HTML 内容
soup = BeautifulSoup(content, 'html.parser')
# 打印网页标题
print(soup.title.text)
Beautifulsoup 的安装十分简单,使用也非常容易,并且具备很好的可扩展性和强大的功能。很多 Web 开发者使用 BeautifulSoup 的原因之一是因为它可以快速轻松地处理常见的 HTML 和 XML 文档。