【发布时间】:2014-12-08 14:29:27
【问题描述】:
我想在 Bash 中通过 wget 下载一个网站,但只有在设定日期之后修改的页面。例如,如果我想下载 Stack Overflow,但仅限于 2014 年 12 月 1 日之后修改的页面。我还想将修改日期的时间戳从服务器写入本地文件名。
使用 wget,这是我目前为止的想法:
wget -m -r -l 9 -t 3 -T 15 -O snapshot-`date +%Y-%m-%d-%H%M%S`.htm -R js,css,jpg,png,gif,pdf,mpg,mp3,mpeg,au,wav,docx,JS,CSS,JPG,PNG,GIF,PDF,MPG,MP3,MPEG,AU,WAV,DOCX,asx,asf,ASX,ASF,WMV,wmv,wma,WMA -erobots=off http://www.example.com
不过,这会告诉我文件的下载日期,而不是服务器修改日期。
谁能帮我解决这个问题?
【问题讨论】:
标签: bash shell command-line wget