【发布时间】:2017-09-28 14:41:54
【问题描述】:
我正在使用Selenium 和Python 来获取网页请求的所有资源的urls(包括通常位于嵌套iframe 内的广告的img url)。但是,这可能不适用于 iframes 中的资源和 ajax 请求。阅读this 上的文档并查看other StackOverflow 答案,您似乎可以使用ExpectedCondition 等待元素出现。但就我而言,我必须加载多个网站(数千个Top Alexa 网站),可能没有任何我可以等待的共同元素。我一直在使用driver.set_page_load_timeout(60),因为60 秒似乎对于所有嵌套的 iframe 最终都出现了足够长的时间。我想知道是否有人可以确认这是否是正确的方法,以及是否有比这更好的方法。谢谢。
编辑:我意识到这个问题之前已经回答过,但是为了澄清我的问题的具体细节,我相信所有这些答案都提供了一个解决方案,可以检测页面上存在的元素,而在我的情况下,我事先没有任何这样的知识。
【问题讨论】:
-
你试过
document.readyState吗?
标签: javascript python selenium