如何在Python中使用 pywebcopy 克隆网页?
有时我们需要在您的本地硬盘驱动器上有一个方便的网页。所以,在这里我们将编写一个简单的Python脚本来报废一个网页。网页抓取用于从网站中提取数据以供离线阅读、存储或任何原因。在编写脚本之前,我们需要了解pywebcopy。 pywebcopy在PyPi上可用,并且可以使用pip 轻松安装。在终端中键入以下命令以安装此模块
pip install pywebcopy
pywebcopy Python包,用于将完整的网页和网站克隆到本地存储。
方法:
- 导入 pywebcopy
- 将参数传递到save_webpage(url=”...”,project_folder=”path/download”,kwargs)
- 检查您给定的位置。
下面是实现。
Python3
from pywebcopy import save_webpage
kwargs = {'project_name': 'site folder'}
save_webpage(
# url pf the website
url='https://www.geeksforgeeks.org/data-structures/linked-list/',
# folder where the copy will be saved
project_folder='F:/ro/geek',
**kwargs
)
输出:
网页的完整克隆被制作并存储在指定的位置。