【发布时间】:2017-02-19 14:35:17
【问题描述】:
在浏览器中显示的网页由 HTML 文档和一些对象(如 CSS、JS、Image 等)组成。我想使用wget 命令将它们全部保存在我的硬盘上,以便稍后从本地计算机。有机会吗?
注意:我想要一个页面,而不是网站的所有页面或类似内容。
【问题讨论】:
在浏览器中显示的网页由 HTML 文档和一些对象(如 CSS、JS、Image 等)组成。我想使用wget 命令将它们全部保存在我的硬盘上,以便稍后从本地计算机。有机会吗?
注意:我想要一个页面,而不是网站的所有页面或类似内容。
【问题讨论】:
使用以下命令:
wget -E -k -p http://example.com
开关细节:
-E:
如果下载了 application/xhtml+xml 或 text/html 类型的文件,并且 URL 不以正则表达式 .[Hh][Tt][Mm][Ll]? 结尾,则此选项将导致后缀 . html 附加到本地文件名。这很有用,例如,当您镜像一个使用 .asp 页面的远程站点,但您希望镜像页面可以在您的库存 Apache 服务器上查看时。另一个很好的用途是当您下载 CGI 生成的材料时。 http://example.com/article.cgi?25 之类的 URL 将保存为 article.cgi?25.html。
-k
下载完成后,将文档中的链接进行转换,使其适合本地查看。这不仅会影响可见的超链接,还会影响文档中链接到外部内容的任何部分,例如嵌入的图像、样式表的链接、非 HTML 内容的超链接等。
-p
此选项使 Wget 下载所有必需的文件 正确显示给定的 HTML 页面。这包括诸如 内联图像、声音和引用的样式表。
【讨论】: