【发布时间】:2020-12-17 02:40:22
【问题描述】:
我正在尝试使用 Scrapy 编写一个网络爬虫,它从目标中爬取产品的价格,但似乎价格是通过 javascript 获得的。我正在考虑使用硒,但我不确定我会如何做到这一点。你有什么建议吗?我的代码如下。
import scrapy
class TargetSpider(scrapy.Spider):
name = 'target'
allowed_domains = ['target.com']
start_urls = ['https://www.target.com/p/red-blend-wine-750ml-bottle-california-roots-8482/-/A-52525405#lnk=sametab']
def parse(self, response):
price = response.xpath('/html/body/div[1]/div/div[5]/div/div[2]/div[2]/div[1]/div[1]/div[1]')
print(price)
【问题讨论】:
-
您的替代方案是使用 selenium(或任何浏览器模拟器)或对该请求进行逆向工程以了解您需要的信息来自何处