📅  最后修改于: 2023-12-03 15:24:19.480000             🧑  作者: Mango
在Python中,我们可以使用多种方法来下载文件。本文将介绍使用标准库和第三方库来下载文件的方法。
urllib是Python中一个用于HTTP协议处理的标准库,我们可以使用它来下载文件。
import urllib.request
url = 'http://example.com/file.txt'
urllib.request.urlretrieve(url, 'file.txt')
以上代码将会从指定的URL下载文件,并将它保存到本地磁盘上的file.txt
中。
如果您需要在下载文件时传入HTTP头,请使用如下代码:
import urllib.request
url = 'http://example.com/file.txt'
headers = {'User-Agent': 'Mozilla/5.0'}
req = urllib.request.Request(url, headers=headers)
urllib.request.urlretrieve(req, 'file.txt')
以上代码将会在下载文件时传入User-Agent
HTTP头,以避免一些网站的反爬虫限制。
requests是一个第三方库,它提供了更加简洁和强大的接口来处理HTTP请求。
import requests
url = 'http://example.com/file.txt'
r = requests.get(url)
with open('file.txt', 'wb') as f:
f.write(r.content)
以上代码将会使用requests库从指定的URL下载文件,并将文件内容保存到本地磁盘上的file.txt
中。
如果您需要在下载文件时传入HTTP头,请使用如下代码:
import requests
url = 'http://example.com/file.txt'
headers = {'User-Agent': 'Mozilla/5.0'}
r = requests.get(url, headers=headers)
with open('file.txt', 'wb') as f:
f.write(r.content)
以上代码将会在下载文件时传入User-Agent
HTTP头,以避免一些网站的反爬虫限制。
以上是在Python中下载文件的方法,它们可以实现下载文件的基本功能,并根据不同的需求来传入不同的HTTP头。如果您需要进一步地掌握Python网络编程的知识,请继续学习socket和异步编程等相关技术。