【问题标题】:Python Selenium: Iteration ErrorPython Selenium:迭代错误
【发布时间】:2017-10-19 12:36:20
【问题描述】:

我正在尝试从网页下载所有 xml 文件。该过程需要一个接一个地找到 xml 文件下载链接,一旦单击这样的下载链接,它就会导致一个需要提交的表单才能开始下载。我面临的问题在于这些循环的迭代,一旦从网页下载第一个文件,我就会收到一个错误:

"selenium.common.exceptions.StaleElementReferenceException: Message: stale 的元素引用:要么元素不再附加到 DOM,要么页面已刷新"

“97081 数据扩展 xml”是迭代中的第二个可下载文件。我特此附上代码,任何纠正此问题的建议将不胜感激。

import os
import time
from selenium import webdriver
from selenium.webdriver.common.keys import Keys
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.common.by import By

fp = webdriver.FirefoxProfile()

fp.set_preference("browser.download.folderList", 2)
fp.set_preference("browser.download.manager.showWhenStarting", False)
fp.set_preference("browser.download.dir", "F:\Projects\Poli_Map\DatG_Py_Dat")
fp.set_preference("browser.helperApps.neverAsk.saveToDisk", "text/xml")

driver = webdriver.Firefox(firefox_profile=fp)

driver.get('https://data.gov.in/catalog/variety-wise-daily-market-prices-data-cauliflower')
wait = WebDriverWait(driver, 10)

allelements = driver.find_elements_by_xpath("//a[text()='xml']")

for element in allelements:
    element.click()
    class FormPage(object):
        def fill_form(self, data):
            driver.execute_script("document.getElementById('edit-download-reasons-non-commercial').click()")
            driver.execute_script("document.getElementById('edit-reasons-d-rd').click()")
            driver.find_element_by_xpath('//input[@name = "name_d"]').send_keys(data['name_d'])
            driver.find_element_by_xpath('//input[@name = "mail_d"]').send_keys(data['mail_d'])
            return self

        def submit(self):
            driver.execute_script("document.getElementById('edit-submit').click()")

    data = {
        'name_d': 'xyz',
        'mail_d': 'xyz@outlook.com',
    }
    time.sleep(5)
    FormPage().fill_form(data).submit()

    time.sleep(5)
    window_before = driver.window_handles[0]
    driver.switch_to_window(window_before)
    driver.back()

【问题讨论】:

    标签: javascript python selenium webdriver iteration


    【解决方案1】:

    我为您找到了解决方法,无需提交任何字段。

    您需要在此图片底部的类字段中获取 ID(此处例如为 962721)

    然后,像这样使用这个 URL: https://data.gov.in/node/962721/download

    这被发现只是做了一些“逆向工程”。当您进行网络抓取时,请始终查看 .js 文件和您的网络选项卡以查看发出的所有请求。

    【讨论】:

      猜你喜欢
      • 2013-11-18
      • 2013-01-12
      • 2023-03-30
      • 1970-01-01
      • 2022-01-10
      • 1970-01-01
      • 2017-03-24
      • 2013-07-02
      • 2020-01-02
      相关资源
      最近更新 更多