python获取网页源码-Python(1)

📌 相关文章

📜 python获取网页源码-Python(1)

📅 最后修改于: 2023-12-03 15:04:41.856000 🧑 作者: Mango

在Python中通过访问URL获取网页的源代码是常见的操作。在本文中，我们将介绍如何使用Python获取网页源码。

Python内置了urllib库，我们可以使用它来获取网页源码。urllib库提供了多个模块，包括请求(request)、错误(error)、解析(parse)等。我们需要用到其中的request模块。

import urllib.request

response = urllib.request.urlopen('https://www.python.org')
html = response.read()
print(html)

上面的代码通过urlopen方法打开了Python官网的网页并获取了网页的源码，将其保存在html变量中。最后使用print方法将源码输出。

除了内置的urllib库，我们还可以使用第三方库requests来获取网页源码。requests库的优点是接口简单，易于使用。

import requests

response = requests.get('https://www.python.org')
html = response.text
print(html)

上面的代码使用requests库发送了一个GET请求，访问了Python官网。通过response的text属性，我们获取了网页源码并将其保存在html变量中。最后使用print方法将源码输出。

以上便是Python获取网页源码的两种方法。通过内置的urllib库或第三方库requests，我们可以方便地获取网页源码，从而对网页进行处理、分析或存储。