【发布时间】:2021-02-03 11:04:08
【问题描述】:
我正在尝试从https://gbr.milesplit.com/athletes/pro/5424599/stats 的 PR College 表中抓取数据 代码看起来像
prTable = wait.until(EC.presence_of_element_located((By.XPATH, '/html/body/div[5]/div/aside/div[4]/table')))
有时我得到的响应是正确的,它是一个包含个人记录的字符串。其他时候它只是从网页上抓取随机信息,有时它无法找到元素。我很困惑为什么它有时会起作用,但并非总是如此。有没有比 xpath 更好的方法,还是我使用了错误的标签?
【问题讨论】:
-
你能用
BeautifulSoup吗? -
我从未使用过 BS,在这种情况下我将如何使用它?
-
我用
beautifulsoup发布了一个例子 -
如果站点是动态的,
bs4将无法完成。 @CMB 既然你说它会获取随机信息,我认为你不应该尝试使用Xpath获取信息。尝试使用类名、id等获取你想要的东西。这种方式更精确。
标签: python selenium web-scraping selenium-chromedriver