【问题标题】:Remove Domain URL from downloaded wbsite by HTTrack通过 HTTrack 从下载的 wbsite 中删除域 URL
【发布时间】:2017-01-18 15:37:13
【问题描述】:

我已经通过 HTTrack 下载了完整的网站。但是在下载该站点后,所有 URL 都包含该站点的域名 url,例如:www.example.com/index.html 而不是 index.html 有没有办法删除这个 url?

【问题讨论】:

    标签: html css url directory httrack


    【解决方案1】:
    1. 如果结构不复杂,您可以在目录中使用搜索/替换选项,我不知道您使用的是什么编辑器/IDE,但都有该选项
    2. 即使您使用的是命令行 httrack 或图形界面,您也可以指定下载链接的格式。

    这是他们文档的一部分:
    构建选项: KN 保留原始链接(例如http://www.adr/link)(K0 *相对链接,K 绝对链接,K3 绝对 URI 链接)(--keep-links[=N])

    【讨论】:

    • 非常感谢您的回答,您知道有没有其他软件可以在不更改任何文件目录的情况下下载整个网站。
    • 我在 linux 上使用 wget 命令,但如果你不使用命令行 httrack 是我所知道的最好的工具,只需在开始下载之前探索和更改选项,不要只使用“下一步”按钮。
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2017-09-20
    • 1970-01-01
    相关资源
    最近更新 更多