使用美丽的汤获取href (1)

📌 相关文章

📜 使用美丽的汤获取href (1)

📅 最后修改于: 2023-12-03 14:49:57.459000 🧑 作者: Mango

使用美丽的汤获取href

如果你正在处理HTML文件或网页，并需要提取链接（href），那么你会发现Python中的BeautifulSoup库非常有用。

BeautifulSoup库提供了一种简单的方法来解析HTML，并允许我们轻松地提取其中的链接。

以下是一个简单的代码示例：

from bs4 import BeautifulSoup
import requests

url = "https://www.python.org/"

# 发送请求并获取响应
r = requests.get(url)

# 创建BeautifulSoup对象并指定解析器
soup = BeautifulSoup(r.content, 'html.parser')

# 查找所有的<a>标签
links = soup.find_all('a')

# 输出所有链接
for link in links:
    print(link.get('href'))

该代码使用requests库发送请求并获取响应，然后使用BeautifulSoup对象解析HTML，并查找所有的标签。最后，它通过循环遍历所有的链接，并使用link.get('href')方法获得链接的href属性值。

此外，BeautifulSoup还提供了一些其他有用的方法来搜索和操作HTML。你可以在它的文档中找到更多信息。

总结

使用BeautifulSoup库可以方便地从HTML中提取链接。这个库有很多强大的功能可以帮助我们解析和操作HTML。