📅  最后修改于: 2023-12-03 15:21:08.478000             🧑  作者: Mango
有时候我们需要对某个网站进行离线查看,但是如果手动复制网站上的每一个页面、图片、文件等会非常耗费时间。这时候 wget
这个工具就可以派上用场了。wget
可以递归下载整个网站并将其保存到本地,同时支持断点续传,可以在网络中断后恢复下载进度,非常方便。
有些网站(例如一些有限制的网站)可能不能通过 wget
直接下载,这时可以在命令中加入 -U
参数模拟浏览器来绕过限制。
下面是 wget
的基本用法:
wget -r -p http://example.com/
参数说明:
-r
:递归下载整个网站,包括子目录和文件。-p
:下载所有用于显示 HTML 页面的文件,包括图片、CSS、JS 等,但不包括视频、音频等二进制文件。http://example.com/
:要下载的网站的 URL。可以通过 -c
参数启用断点续传功能:
wget -c -r -p http://example.com/
参数说明:
-c
:支持断点续传,可以在下载中途中断,下次再运行 wget
时会自动从上次下载的地方继续下载。如果你只想下载网站中的某些文件类型,可以使用 --accept
参数来指定:
wget -r -p --accept=jpg,png,gif http://example.com/
参数说明:
--accept=jpg,png,gif
:只下载 JPG、PNG、GIF 格式的图片。如果你下载的网站有一些限制,可以尝试在命令中加入 -U
参数,并添加一个自己的用户代理来绕过限制:
wget -U "Mozilla/5.0 (Windows NT 6.1; WOW64; rv:40.0) Gecko/20100101 Firefox/40.0" -r -p http://example.com/
参数说明:
-U
:指定用户代理。"Mozilla/5.0 (Windows NT 6.1; WOW64; rv:40.0) Gecko/20100101 Firefox/40.0"
:自定义的用户代理。wget
是一个非常强大的工具,可以让我们轻松地下载整个网站,支持断点续传、自定义用户代理、指定要下载的文件类型等。当我们需要对网站进行离线查看时, wget
是一个非常好用的工具,希望大家能够掌握它的使用方法。