【发布时间】:2015-06-16 04:15:11
【问题描述】:
我想用 nodejs 下载一个网页,比如http://www.stackoverflow.com。这意味着我有静态页面的离线副本。它必须下载资源(如样式、javascript 文件、图像等)并更新对本地资源的引用。
在任何情况下,我都希望一个打开后的离线页面看起来与真实页面完全一样。就像我在网络浏览器中选择文件->保存时发生的情况一样。
基本上我想复制
的功能wget --page-requisites
(虽然这不能正确下载css和图片)
背景是我想在外部网站上执行Javascript。由于跨域策略,这(正确地)是不可能的。为了避免这种情况,我只想下载网站并自己静态托管,执行我的 Javascript 分析代码,然后将其删除。
【问题讨论】:
标签: javascript node.js cross-domain