【发布时间】:2021-01-21 06:45:50
【问题描述】:
我对网络抓取非常陌生,我正在尝试为我的一个项目获取“设施和更多”下的项目。如下所示,我想从餐厅的 Yelp 页面中提取“健康评分优秀”、“提供外卖”、“提供外卖等”。我想为其他几家餐厅的 Yelp 页面执行此操作,但现在我将决定只搞清楚这个问题。
据我了解,我从不同的网页中了解,但没有得到很好的结果。
url='https://www.yelp.com/biz/ziggis-coffee-longmont'
yelp_page=requests.get(url)
yelp_soup=BeautifulSoup(yelp_page.content, 'lxml')
yelp_soup.find_all("span")
结果[<span class="offscreen" id="page-content"> </span>]
当我点击“Offers Takeout”上方的“inspect”时,我正在选择“span”。
我尝试过的其他方法是:
yelp_soup.find_all("span",{'class': "text__373c0__2Kxyz text-color--normal__373c0__3xep9 text-align--left__373c0__2XGa- text-weigt--semibold__373c0__h2l0fe text-size--large__373c0__3t60B"})
和
yelp_soup.find_all("span",{'class': "text__373c0__2Kxyz"})
结果:[]
请建议如何进行。 谢谢
【问题讨论】:
标签: python web-scraping beautifulsoup