【发布时间】:2020-04-16 07:29:14
【问题描述】:
import bs4
import requests
url = requests.get(
'https://www.telemart.pk/mobile-and-tablets/mobile-phone.html')
soup = bs4.BeautifulSoup(url.text, features='lxml')
print(soup)
我想抓取价格、图片链接、产品链接、每件商品的标题,但数据在 XHR 中。那么我如何从 xhr 中抓取数据
【问题讨论】:
-
您提供的链接下没有任何内容,只有:在此条件中未找到产品
-
再看看我修改了它
-
哦,它是网站动态下载的……你用
requests是不会得到的。尝试使用Selenium,在加载一些动态内容后,您可以使用它来获取网站。检查例如这里:towardsdatascience.com/… -
但如果您在检查中看到,然后转到网络选项卡,然后转到 xhr,那么您可以看到“0”以及其中存在的所有数据
标签: python python-3.x web-scraping beautifulsoup