【问题标题】:Waiting for a Page to Load in Selenium/Firefox w/ Python [duplicate]等待使用 Python 在 Selenium/Firefox 中加载页面 [重复]
【发布时间】:2016-09-22 05:07:31
【问题描述】:

如何等待页面在 Selenium 中加载,然后才能获取其源代码?我正在尝试从页面获取信息,但它加载了 javascript,因此仅访问源代码并没有给我任何东西。我目前正在使用 time.sleep 等待 javascript 加载,但有更快的方法吗?

Firefox.get(url)
WebDriverWait(FireFox, timeout=60)
time.sleep(5)
source = Firefox.page_source

然后我可以在页面的来源中搜索我需要的信息,但是有更快的方法吗?我可以将值设置为 2 秒或更快,但是一个慢速页面可能会破坏程序。删除 time.sleep 会破坏程序,因为 javascript 没有运行并且程序找不到它正在寻找的信息。

【问题讨论】:

  • 请提供一些示例 html 并指出由异步 javascript 填充的元素。
  • @user2272115 我正在开发 VSCO 开膛手,所以该网站上的任何图像。 vsco.co/vincentdemers/media/573bb798ee5e1d0c03edbe1f。我正在尝试尽快从每个页面获取发布图像的日期,我宁愿不必等待任意时间。

标签: python python-3.x selenium selenium-webdriver


【解决方案1】:

这会在获取页面源之前等待图像显示。

from selenium import webdriver
from selenium.webdriver.support.ui import WebDriverWait

browser = webdriver.Firefox()
browser.get('https://vsco.co/vincentdemers/media/573bb798ee5e1d0c03edbe1f')
WebDriverWait(browser, 10).until(lambda d: d.find_element_by_css_selector('#ember610 > img').is_displayed())
source = browser.page_source
browser.close

您可以使用任何方法或选择器来查找要等待的元素。

【讨论】:

  • 感谢您的帮助!我会支持你,但我没有声誉。
猜你喜欢
  • 2017-03-27
  • 1970-01-01
  • 2018-03-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2018-11-26
  • 1970-01-01
  • 2011-08-17
相关资源
最近更新 更多