【问题标题】:tbody don't appear when I scrape data python selenium当我抓取数据 python selenium 时,tbody 不会出现
【发布时间】:2020-08-10 09:54:08
【问题描述】:

我尝试提取表中的数据但不成功--"

我在网站上看到: (https://ades.eaufrance.fr/Fiche/PtEau?Code=00696X0126/F2)

这是我的代码:

browser = webdriver.PhantomJS(executable_path = PhantomJSpath)
url = 'https://ades.eaufrance.fr/Fiche/PtEau?Code=00871X0002'
browser.get(url)
browser.implicitly_wait(10)
soup = bs(browser.page_source, features='lxml')
tables = soup.find_all('table')
for elem in tables:
    print(elem)

我得到了表格,但元素“tbody”消失了: My scraping

我做错了什么? 如果有人可以告诉我路径谢谢。

【问题讨论】:

  • 8,其中 5 个具有<tbody>。你的用例是什么?你想做什么?
  • 我想提取前两个表的数据。但我只有每个表的标题

标签: python-3.x selenium web-scraping https datatable


【解决方案1】:

元素 tbody 在您的结果中不存在,因为您正在抓取 page_source,但不是实际呈现的 HTML 树。请注意,您的浏览器在呈现页面时添加了 tbody 元素。 恕我直言,这根本不是问题,所以您不必担心这个“问题”

附:我建议使用内置的 Selenium 方法/属性从页面获取数据,而不是使用 3 方 BeautifulSoup 库

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2021-06-29
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2020-10-21
    • 2016-11-19
    相关资源
    最近更新 更多