【发布时间】:2018-07-29 12:09:25
【问题描述】:
我从一个网站中读取了一些 HTML,我试图将其解析为一个汤对象。之后,我提取了我查看过的 HTML 正文,发现它确实包含我正在寻找的项目。
我要查找的项目包含在<div> 标记内,带有class = 'listitem artikal obicniArtikal imaHover-disabled i index'.
现在我正在尝试做:
r = requests.get('https://www.olx.ba/pretraga?trazilica=golf+2', timeout=5)
soup = BeautifulSoup(r.text, 'html.parser')
body = soup.find('div', attrs={'id':'rezultatipretrage'})
all_items = body.find_all('div', class_='listitem artikal obicniArtikal imaHover-disabled i index')
print(all_items)
all_items 返回一个空列表,即使标签存在于body 中。
如果有人能告诉我发生了什么,我将不胜感激。
【问题讨论】:
标签: python html web-scraping beautifulsoup tags