【发布时间】:2021-12-31 16:48:24
【问题描述】:
我一直在尝试从这个网站上找到这张桌子:https://consultas.anvisa.gov.br/#/medicamentos/25351532892201972/
我在下面使用这个方法:
from bs4 import BeautifulSoup
import requests
url= "https://consultas.anvisa.gov.br/#/medicamentos/25351532892201972/"
page = requests.get(url, verify=False)
soup = BeautifulSoup(page.content, 'html.parser')
print(soup.prettify())
for table in soup.find_all('table'):
print(table)
for subtable in table.find_all('table'):
print(subtable)
没有任何结果,因为不知何故表格似乎被隐藏了。我可以使用 firefox 检查器(下图)查看标签和表格,但 BeautifulSoup 无法使用我迄今为止尝试的方法找到它。
我该怎么做才能找到这些隐藏的嵌套表?我已经尝试了很多方法通过soup.find(), soup.find_all(), soup.body.div.table.find_all() 找到它,但还没有成功。
提前谢谢你们! =)
【问题讨论】:
-
总是先看看你的汤——这就是真相。内容总是与开发工具中的视图略有不同。内容是动态提供的,所以你应该用 selenium 试试。
-
https://consultas.anvisa.gov.br/api/consulta/medicamento/produtos/25351532892201972
标签: python web-scraping beautifulsoup