📜  如何在 python 中下载文件(1)

📅  最后修改于: 2023-12-03 15:24:19.480000             🧑  作者: Mango

如何在Python中下载文件

在Python中,我们可以使用多种方法来下载文件。本文将介绍使用标准库和第三方库来下载文件的方法。

使用urllib库下载文件

urllib是Python中一个用于HTTP协议处理的标准库,我们可以使用它来下载文件。

import urllib.request

url = 'http://example.com/file.txt'
urllib.request.urlretrieve(url, 'file.txt')

以上代码将会从指定的URL下载文件,并将它保存到本地磁盘上的file.txt中。

如果您需要在下载文件时传入HTTP头,请使用如下代码:

import urllib.request

url = 'http://example.com/file.txt'
headers = {'User-Agent': 'Mozilla/5.0'}
req = urllib.request.Request(url, headers=headers)
urllib.request.urlretrieve(req, 'file.txt')

以上代码将会在下载文件时传入User-Agent HTTP头,以避免一些网站的反爬虫限制。

使用requests库下载文件

requests是一个第三方库,它提供了更加简洁和强大的接口来处理HTTP请求。

import requests

url = 'http://example.com/file.txt'
r = requests.get(url)

with open('file.txt', 'wb') as f:
    f.write(r.content)

以上代码将会使用requests库从指定的URL下载文件,并将文件内容保存到本地磁盘上的file.txt中。

如果您需要在下载文件时传入HTTP头,请使用如下代码:

import requests

url = 'http://example.com/file.txt'
headers = {'User-Agent': 'Mozilla/5.0'}
r = requests.get(url, headers=headers)

with open('file.txt', 'wb') as f:
    f.write(r.content)

以上代码将会在下载文件时传入User-Agent HTTP头,以避免一些网站的反爬虫限制。

结论

以上是在Python中下载文件的方法,它们可以实现下载文件的基本功能,并根据不同的需求来传入不同的HTTP头。如果您需要进一步地掌握Python网络编程的知识,请继续学习socket和异步编程等相关技术。