📜  检查状态码 urllib 打开 - Python (1)

📅  最后修改于: 2023-12-03 14:55:49.570000             🧑  作者: Mango

检查状态码 urllib 打开 - Python

简介

在使用 Python 中的 urllib 库打开 URL 的过程中,我们需要检查返回的状态码以确保是否能够成功获取网页数据。本文将介绍如何使用 urllib 库打开 URL 并检查返回的状态码,从而确定我们是否已成功获取了网页数据。

操作步骤
打开 URL

我们可以使用 urllib 库中的 urlopen() 方法来打开 URL,例如:

import urllib.request

url = 'https://www.baidu.com'
response = urllib.request.urlopen(url)
检查状态码

打开 URL 后,我们需要检查返回的状态码,以确定是否成功获取了网页数据。HTTP 状态码是一个三位数,第一位数字表示状态类别,后两位数字没有分类的作用。常见的状态码如下:

  • 200:请求成功。
  • 301/302:页面重定向。
  • 404:请求的页面不存在。
  • 500:服务器内部错误。

我们可以通过 response 对象的 status 属性来获取状态码,例如:

import urllib.request

url = 'https://www.baidu.com'
response = urllib.request.urlopen(url)
status_code = response.status

if status_code == 200:
    print('请求成功')
else:
    print('请求失败:', status_code)

在上面的例子中,我们检查了状态码是否为 200,如果是则输出“请求成功”,否则输出“请求失败”和状态码。根据实际情况可选择不同的操作。

总结

本文介绍了如何使用 urllib 库打开 URL 并检查返回的状态码。通过检查状态码,我们可以确定是否成功获取了网页数据。在实际使用中,我们应该根据 HTTP 状态码的含义来选择不同的处理方式。