【问题标题】:How can I make HTTrack only download files on the current domain?如何使 HTTrack 仅下载当前域上的文件?
【发布时间】:2014-05-02 05:49:13
【问题描述】:

无论我多么努力,我似乎​​都无法让 httrack 保持指向其他域的链接完好无损。我尝试过使用 --stay-on-same-domain 参数,但似乎没有这样做。我也尝试过添加过滤器并没有这样做。

必须有一些我在这里缺少的选项。

【问题讨论】:

    标签: http download httrack


    【解决方案1】:

    将选项“最大外部深度”设置为0 不起作用,即使它应该是预期的。

    什么有效:

    转至 > 选项 > 扫描规则并在文本字段(额外行)中输入:-* +*yourdomain.com/*

    这里有更多设置需要了解:HTTrack: How to download folders only from a certain subfolder level?

    【讨论】:

    • 每次都必须在扫描规则中手动指定域是多么令人沮丧。 ?‍♂️ 它真的应该检测到这一点。
    • 当我这样做时,它减少了从其他域下载的页面数量 - 但奇怪的是没有减少到零。一些页面仍然是从其他域下载的。
    【解决方案2】:

    将最大外部深度设置为 0。在 GUI 中可以找到:

    如果你使用的是命令行版本,选项是

    %e0
    

    [注:非HTTRACK专家,如有需要请指正]

    【讨论】:

    • 这并不总是有效。我的设置与您的屏幕截图相同,但我也从 Wikipedia 获得了许多页面。 ?
    【解决方案3】:

    在“设置选项”>“限制”中,尝试

    Maximum mirroring depth = 1(保留这个2,当1不起作用时)

    还有

    Maximum external depth = 0

    为我工作!

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2012-08-07
      • 1970-01-01
      • 2017-01-18
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多