【发布时间】:2016-10-24 17:36:28
【问题描述】:
我有一个页面可能以某种方式受到无头浏览器刮擦的保护,但我当然不确定。问题是,在浏览器中它加载良好,javascript 执行并且一切都很好。使用 phanthomjs 时,它没有,似乎 javascript 没有执行或出现其他问题。
我怎样才能知道呢?你推荐什么来抓取该页面?
【问题讨论】:
-
@ArtjomB.,这是我的网站。
-
phantomjs 会崩溃吗?返回你的空页面?你有一些代码吗?你如何调用phantomjs?也尝试设置用户代理
-
@Jio 你能展示你的代码,或者你正在尝试的简化版本吗?如果可能的话,还有你试图抓取的网址。
标签: javascript web-scraping phantomjs headless-browser