【发布时间】:2012-05-17 18:44:18
【问题描述】:
我正在做这个项目,我基本上需要能够在任何页面上放置一个 html 按钮(可以受登录保护),一旦用户点击该按钮,页面 html 和依赖项(css、js、图片等)应发送到远程服务器。
最初,我通过使用 iframe 和隐藏表单并在用户单击按钮时将页面的 url 发布到远程服务器来使其工作。然后我在 exec 中使用 wget 来获取页面和依赖项。但是,这显然不适用于受保护的页面。
所以我的下一个方法是通过表单将页面的 innerHTML 发送到远程服务器上的 php 脚本。然后我尝试使用 simplehtmldom 运行 , 和 tags ,将相对 url 转换为绝对 url ,将它们存储在数组中,并将 url 替换为同一目录中的路径。然后我在所有数组上应用 wget 并下载了这些依赖项。
但是,我又被卡住了,因为 CSS 中有背景图片,而 javascript 中有嵌入的 html 代码。
有人可以提出更好的解决方案吗?
谢谢
【问题讨论】:
-
是什么阻止你解析 CSS 和 JS?
-
我刚开始认为这不是一个好方法。我的意思是我还必须解析 CSS 和 js 文件中的 url,它们可能无法正确解析。
-
如果网站是基于 AJAX 的,你的技术就会失败。
-
不确定你的意思是什么?我只想在 dom 加载后捕获东西。
-
你有远程服务器的shell访问权限吗?如果是这样,我建议让客户端向服务器发送一条消息以执行
wget -p -k [thepage]。让服务器拉取内容,而不是让客户端推送。
标签: php javascript web download copy