【发布时间】:2010-09-28 21:26:16
【问题描述】:
我想完全镜像几个不同网站上的几个网页。这意味着我需要图像、CSS 等,并且需要转换链接。此功能类似于使用 Firefox 来“将页面另存为”并选择“网页,完成”。我想将文件和相应的目录命名为合理的名称(例如 myfavpage1.html、myfavpage1.dir)。
我无权访问服务器,它们也不是我的页面。这是一个示例链接:Click Me!
再澄清一点...我有大约 100 个页面要镜像(许多来自慢速服务器),我将在 Solaris 10 上执行任务,并每小时将结果转储到 samba 挂载以供人们使用查看。而且,是的,我显然已经尝试了 wget 几个不同的标志,但我没有得到我正在寻找的结果。 因此,指向 GNU wget 页面并没有真正的帮助。让我从一个简单的例子开始。
wget --mirror -w 2 -p --html-extension --tries=3 -k -P stackperl.html "https://stackoverflow.com/tags/perl"从此,如果我的标志正确,我应该会在 stackper.html 文件中看到 https://stackoverflow.com/tags/perl 页面。
【问题讨论】:
-
这里有很多不清楚的地方。您有权访问服务器吗?如果是这样,那么有比您建议的通过网络客户端进行粗暴文件复制更好的方法。如果没有,你在做什么从不是你自己的服务器上抓取和发布内容?请提供细节;它会帮助我们回答。
-
我没有刮任何东西。我想做我所描述的。我想完全镜像来自几个不同站点的特定网页,以便我可以在本地阅读它们。我描述了使用 Firefox 的功能。 Safari 也有同样的功能。