【发布时间】:2017-06-19 00:13:37
【问题描述】:
我正在尝试找到一种方法来使它们协同工作。而我可以使用 Wget for Windows 成功运行它:
wget --html-extension -r http://www.sitename.com
这会下载我的服务器上的每个文件,这些文件是从根域链接的目录。我宁愿只下载我的站点地图中的页面。为此,我发现了以下使用 CygWin 的技巧:
wget --quiet https://www.sitename.com/sitemap.xml --output-document - | egrep -o
"http://www\.sitename\.com[^<]+" | wget --spider -i - --wait 1
但这只是检查页面是否存在,而不是像之前的 wget 命令那样将它们下载为静态 HTML 文件。
有没有办法合并这些并将站点地图页面下载为本地 html 文件?
【问题讨论】: