📜  wget 下载网站供离线查看 - Shell-Bash (1)

📅  最后修改于: 2023-12-03 15:21:08.478000             🧑  作者: Mango

wget 下载网站供离线查看

介绍

有时候我们需要对某个网站进行离线查看,但是如果手动复制网站上的每一个页面、图片、文件等会非常耗费时间。这时候 wget 这个工具就可以派上用场了。wget 可以递归下载整个网站并将其保存到本地,同时支持断点续传,可以在网络中断后恢复下载进度,非常方便。

用法

有些网站(例如一些有限制的网站)可能不能通过 wget 直接下载,这时可以在命令中加入 -U 参数模拟浏览器来绕过限制。

基本用法

下面是 wget 的基本用法:

wget -r -p http://example.com/

参数说明:

  • -r:递归下载整个网站,包括子目录和文件。
  • -p:下载所有用于显示 HTML 页面的文件,包括图片、CSS、JS 等,但不包括视频、音频等二进制文件。
  • http://example.com/:要下载的网站的 URL。
断点续传

可以通过 -c 参数启用断点续传功能:

wget -c -r -p http://example.com/

参数说明:

  • -c:支持断点续传,可以在下载中途中断,下次再运行 wget 时会自动从上次下载的地方继续下载。
针对特定文件类型下载

如果你只想下载网站中的某些文件类型,可以使用 --accept 参数来指定:

wget -r -p --accept=jpg,png,gif http://example.com/

参数说明:

  • --accept=jpg,png,gif:只下载 JPG、PNG、GIF 格式的图片。
绕过限制

如果你下载的网站有一些限制,可以尝试在命令中加入 -U 参数,并添加一个自己的用户代理来绕过限制:

wget -U "Mozilla/5.0 (Windows NT 6.1; WOW64; rv:40.0) Gecko/20100101 Firefox/40.0" -r -p http://example.com/

参数说明:

  • -U:指定用户代理。
  • "Mozilla/5.0 (Windows NT 6.1; WOW64; rv:40.0) Gecko/20100101 Firefox/40.0":自定义的用户代理。
总结

wget 是一个非常强大的工具,可以让我们轻松地下载整个网站,支持断点续传、自定义用户代理、指定要下载的文件类型等。当我们需要对网站进行离线查看时, wget 是一个非常好用的工具,希望大家能够掌握它的使用方法。