📜  python获取网页源码-Python(1)

📅  最后修改于: 2023-12-03 15:04:41.856000             🧑  作者: Mango

Python获取网页源码

在Python中通过访问URL获取网页的源代码是常见的操作。在本文中,我们将介绍如何使用Python获取网页源码。

使用urllib库获取网页源码

Python内置了urllib库,我们可以使用它来获取网页源码。urllib库提供了多个模块,包括请求(request)、错误(error)、解析(parse)等。我们需要用到其中的request模块。

import urllib.request

response = urllib.request.urlopen('https://www.python.org')
html = response.read()
print(html)

上面的代码通过urlopen方法打开了Python官网的网页并获取了网页的源码,将其保存在html变量中。最后使用print方法将源码输出。

使用requests库获取网页源码

除了内置的urllib库,我们还可以使用第三方库requests来获取网页源码。requests库的优点是接口简单,易于使用。

import requests

response = requests.get('https://www.python.org')
html = response.text
print(html)

上面的代码使用requests库发送了一个GET请求,访问了Python官网。通过responsetext属性,我们获取了网页源码并将其保存在html变量中。最后使用print方法将源码输出。

总结

以上便是Python获取网页源码的两种方法。通过内置的urllib库或第三方库requests,我们可以方便地获取网页源码,从而对网页进行处理、分析或存储。