【问题标题】:wget with many pageswget 有很多页面
【发布时间】:2012-11-17 18:30:25
【问题描述】:

wget 中的-k 选项根据链接到的文件是否也被下载,将链接转换为本地或远程链接。 (详情请见here

是否可以这样使用wget:我下载了两个网页,比如说www.example.com/1www.example.com/2,其中第一页有到第二页的链接,wget将链接转换为本地, 因为第二页也被下载了。

注意:我无法使用深度为 1 的递归选项下载www.example.com/1,因为www.example.com/1 可能有指向其他页面的链接,而我只想要www.example.com/2

【问题讨论】:

    标签: web wget


    【解决方案1】:

    这应该可以解决问题:

    wget -kp www.example.com/1 www.example.com/2
    

    来自您链接的网站:

    ‘-p’ ‘--page-requisites’ 这个选项会导致 Wget 下载所有 正确显示给定 html 页面所必需的文件。这个 包括内嵌的图像、声音和引用的内容 样式表。

    【讨论】:

    • 那是两个独立的wgets,我认为从www.example.com/1www.example.com/2的链接不会被转换为本地链接。
    • 试试看。我不确定您是否可以做得更好,至少使用 wget。
    • 我试过了,它并没有将链接转换为本地链接。也许我们真的不能做得比这更好,但我只是好奇:)
    • 你总是可以用 sed 完成它:)
    • 我要奖励赏金,但它说我必须等待 2 小时 :)
    猜你喜欢
    • 2011-12-11
    • 2011-09-11
    • 2015-07-31
    • 2012-06-02
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多