【发布时间】:2020-11-09 09:05:40
【问题描述】:
我想抓取可以在此webpage 上找到的图表数据。为此,我在 Python (Pycharm) 中使用 Selenium。到目前为止,这是我的代码:
from selenium import webdriver
mozilla_path = r"C:\Users\ivrav\Python38\geckodriver.exe"
driver = webdriver.Firefox()
driver.get("https://scholar.google.com/citations?user=8Cuk5vYAAAAJ&hl=en")
driver.maximize_window()
Researcher=driver.find_element_by_xpath("""//*[@id="gsc_rsb_cit"]/div/div[3]/div""") .click()
Graph=driver.find_elements_by_id("gsc_md_hist_b")
print(Graph.text)
代码工作正常,直到它必须从图表中获取信息(年份和每年的引用),回复是没有要刮的文本。 您能否给我一些关于如何抓取所需信息的想法?
提前非常感谢, 伊万
【问题讨论】:
-
您也可以直接查找
<span>的类.gsc_g_t多年来,而引用计数在<span class="gsc_g_al"> </span>。
标签: python selenium selenium-webdriver xpath webdriverwait