📅  最后修改于: 2023-12-03 15:04:41.856000             🧑  作者: Mango
在Python中通过访问URL获取网页的源代码是常见的操作。在本文中,我们将介绍如何使用Python获取网页源码。
Python内置了urllib
库,我们可以使用它来获取网页源码。urllib
库提供了多个模块,包括请求(request
)、错误(error
)、解析(parse
)等。我们需要用到其中的request
模块。
import urllib.request
response = urllib.request.urlopen('https://www.python.org')
html = response.read()
print(html)
上面的代码通过urlopen
方法打开了Python
官网的网页并获取了网页的源码,将其保存在html
变量中。最后使用print
方法将源码输出。
除了内置的urllib
库,我们还可以使用第三方库requests
来获取网页源码。requests
库的优点是接口简单,易于使用。
import requests
response = requests.get('https://www.python.org')
html = response.text
print(html)
上面的代码使用requests
库发送了一个GET
请求,访问了Python
官网。通过response
的text
属性,我们获取了网页源码并将其保存在html
变量中。最后使用print
方法将源码输出。
以上便是Python获取网页源码的两种方法。通过内置的urllib
库或第三方库requests
,我们可以方便地获取网页源码,从而对网页进行处理、分析或存储。