📅  最后修改于: 2023-12-03 15:36:36.367000             🧑  作者: Mango
在我们的日常生活和工作中,时常需要从互联网上下载PDF文件。本文将介绍如何使用Python编写脚本从链接下载PDF文件。
我们需要安装 requests
和 beautifulsoup4
这两个库来实现从链接下载PDF。
!pip install requests beautifulsoup4
需要先获取需要下载的PDF文件的链接。这可以通过浏览器开发者工具(F12)中的 Network 功能获取到。也可以通过Python代码获取链接(例如使用 beautifulsoup
解析HTML)。
import requests
from bs4 import BeautifulSoup
url = 'https://www.samplepdf.com/sample.pdf'
response = requests.get(url)
我们可以通过 response.content
获取文件内容,也可以通过设置 stream=True
实现大文件的下载。
with open('sample.pdf', 'wb') as f:
f.write(response.content)
完整代码如下:
import requests
from bs4 import BeautifulSoup
url = 'https://www.samplepdf.com/sample.pdf'
response = requests.get(url)
with open('sample.pdf', 'wb') as f:
f.write(response.content)
以上就是使用Python从链接下载PDF文件的方法。