【发布时间】:2021-03-08 01:10:09
【问题描述】:
我正在尝试使用自定义函数从 div 父节点中选择所有 table 元素。
这是我目前得到的:
import BeautifulSoup
import requests
import lxml
url = 'https://www.salario.com.br/profissao/abacaxicultor-cbo-612510'
def getTables(url):
url = requests.get(url)
soup=BeautifulSoup(url.text, 'lxml')
div_component = soup.find('div', attrs={'class':'td-post-content'})
tables = div_component.find_all('table', attrs={'class':'listas'})
return tables
但是,当应用为getTables(url) 时,输出是一个空列表[]。
我希望这个函数返回 div 节点内的所有 html 表格元素给定他的特定属性。
如何调整此功能?
我可以使用任何其他库来完成这项任务吗?
【问题讨论】:
标签: python html function web-scraping beautifulsoup