【发布时间】:2018-01-16 02:59:18
【问题描述】:
我想抓取以下页面
html='https://www.quintoandar.com.br/alugar/imovel/sao-paulo-sp-brasil/1-vagas/de-20-a-75-m2/de-500-a-4400-reais/apartamento')
为了得到租金价格,总值和位置,存储为每张图片下方的三行文本。
我试过了
import requests
from bs4 import BeautifulSoup
page=requests.get(html)
soup = BeautifulSoup(page.content, 'html.parser')
for tag in soup.findAll('div'):
if tag.has_attr('class'):
span=tag.findAll('span')
print(span.text)
我的意图是进入带有class属性的div标签,找到里面的span类,然后获取它们的文本。这就是对 html 的检查所暗示的。
但是,我什么也没得到。好像没有任何 div 标签。
有什么线索吗?
【问题讨论】:
-
SCRAPPING呵呵!!在创建任何帖子之前,至少尝试用谷歌搜索要在标题中使用的正确关键字。
标签: python web-scraping beautifulsoup