【问题标题】:Save an html page + change all links to point to the right place保存 html 页面 + 更改所有链接以指向正确的位置
【发布时间】:2009-06-02 18:47:55
【问题描述】:

你可能知道IE有这个可以保存网页的东西,它会自动下载html文件以及html文件使用的所有image/css/js文件。

现在有一个问题 - html 文件中的链接没有更改。 因此,如果我下载 example.com 的 html 页面,它有一个 ,我用 IE 下载的页面将有一个指向 C:\Documents and Settings...的链接...(文件夹的路径html 文件在其中)。

是否有一个 python 库可以为我下载一个 html 页面,以及它的所有内容(images/js/css)? 如果是,是否有图书馆也可以为我更改链接?

谢谢!!

【问题讨论】:

标签: javascript python html css screen-scraping


【解决方案1】:

由于您特别提到了 IE,我不确定这对您是否有用,但在 linux 上,完全镜像网站的最简单方法是使用 wget 命令。

wget --mirror --convert-links -w 1 http://www.example.com

如果您需要更多选项,请运行 man wget。

【讨论】:

    【解决方案2】:

    我已经编写了一个工具来将网页保存到一个独立的 html 文件中,并且链接指向应该指向的相同位置。

    https://github.com/zTrix/webpage2html

    【讨论】:

      猜你喜欢
      • 2016-04-07
      • 1970-01-01
      • 2021-06-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2011-04-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多