【发布时间】:2021-06-25 16:25:21
【问题描述】:
我正在尝试获取位于多个嵌套内的表。 我是 Beautifulsoup 的新手,我练习了一些简单的 eeemples。 问题是,我不明白为什么我的代码无法获得具有“Explorer is-embed”类的“div”标签。 因为从那时起,我可以更深入地找到我想要抓取的所有数据所在的 tbody。 提前感谢您的帮助。
下面是我的代码:
url = "https://ourworldindata.org/covid-cases"
url_content = requests.get(url)
soup = BeautifulSoup(url_content.text, "lxml")
########################
div1 = soup3.body.find_all("div", attrs={"class":"content-wrapper"})
div2 = div1[0].find_all("div", attrs={"class":"offset-content"})
sections = div2[0].find_all('section')
figure = sections[1].find_all("figure")
div3 = figure[0].find_all("div")
div4 = div3[0].find_all("div")
这是我没有得到的“div”标签的快照。 Figure
【问题讨论】:
标签: python html beautifulsoup html-tbody