【发布时间】:2020-03-09 15:15:06
【问题描述】:
我有兴趣从 https://www.hltv.org/team/7532/big 等网页自动抓取。更准确地说,我想从您将鼠标悬停在绘图上时显示的框中提取日期和#ranking(请参见下面的屏幕截图)
我尝试将 python 与 selenium 结合使用,但我真的不知道如何进一步进行,尽管我经历了不同的教程。我觉得我需要更改样式属性的顶部和左侧值,但我不知道该怎么做以及是否应该使用 xpath、css 选择器或其他任何东西。这是我的一段代码,它返回我感兴趣的 WebElement(大概),但我没有设法从中提取任何东西:(
from selenium import webdriver
from selenium.webdriver.common.action_chains import ActionChains
options = webdriver.ChromeOptions()
options.add_argument('--ignore-certificate-errors')
options.add_argument('--incognito')
options.add_argument('--headless')
executable_path=r'C:/Users/fabbe/Documents/Python Scripts/hltv/chromedriver/chromedriver.exe'
driver = webdriver.Chrome(executable_path, chrome_options=options)
driver.get("https://www.hltv.org/team/7532/big")
elements = driver.find_elements_by_xpath("//*[@id='fusioncharts-tooltip-element']")
【问题讨论】:
-
如果您使用的是 FusionCharts,您可以在将鼠标悬停在数据图上时使用它们的 API 事件来获取值,您可以使用 dataPlotRollOver 事件,这是一个演示 - jsfiddle.net/fusioncharts/w5tcppk8
标签: python selenium screen-scraping