【发布时间】:2013-08-18 08:09:38
【问题描述】:
使用诸如 cURL 或(在 PHP 中)流上下文/file_get_contents 之类的东西来获取页面的起始 HTML 标记非常简单,但如今,有如此多的页面受到 JS 的严格控制,即使你得到了开始标记页面时,您仍然无法轻易确定页面的实际构成(因为页面的大部分是由运行客户端的 JS 构成的)。
因此,是否有可能在页面的所有加载 JS 通过使用诸如 cURL 之类的东西执行之后获取页面的整个 DOM 结构?
(作为额外的信息,我知道您可以使用 Chrome 开发工具等获得 DOM 结构,但我想知道是否有任何方法可以自动化该过程。)
非常感谢。
【问题讨论】:
标签: javascript dom curl google-chrome-devtools onload