📜  Beautiful Soup-安装(1)

📅  最后修改于: 2023-12-03 15:29:36.405000             🧑  作者: Mango

Beautiful Soup-安装

Beautiful Soup是一个Python库,用于从HTML和XML文件中提取数据。它通常用于爬虫程序中,帮助我们更轻松地解析HTML页面,获取所需要的信息。

安装

Beautiful Soup是一个第三方库,因此需要使用pip命令安装。在终端中输入以下命令:

pip install beautifulsoup4
使用

安装完成后,我们可以在Python代码中使用Beautiful Soup进行解析。以下是一个简单示例,用于从HTML中提取所有链接:

from bs4 import BeautifulSoup
import requests

# 发送请求获取HTML代码
url = 'https://www.example.com'
response = requests.get(url)
html = response.text

# 使用Beautiful Soup解析HTML
soup = BeautifulSoup(html, 'html.parser')
links = []
for link in soup.find_all('a'):
    links.append(link.get('href'))
    
print(links)

以上示例展示了Beautiful Soup的一些常规用法。如果你想了解更多关于Beautiful Soup的内容,可以查看官方文档:https://www.crummy.com/software/BeautifulSoup/bs4/doc/