【发布时间】:2017-10-19 22:33:45
【问题描述】:
我正在学习 scrapy(使用 splash)并构建一个爬虫来从启用 js 的页面中抓取结果。我的蜘蛛工作并且确实返回了 js 页面的结果。但是,它不会从此链接返回价格https://www.zara.com/us/en/bejewelled-appliqu%C3%A9-dress-p07854034.html?v1=4818592&v2=733885
xpath used: //*[contains(concat( " ", @class, " " ), concat( " ", "_product-price", " " ))]//span/text()
上面的 xpath 确实会在浏览器中返回结果,但在通过 scrapy 调用时不会返回结果。这是我的蜘蛛电话
yield scrapy.Request(url, callback=self.parse_page, dont_filter=True, meta={'splash': {'args': {'wait': 5,},'endpoint': 'render.html',}})
请您帮忙弄清楚为什么网站的价格没有返回?
谢谢!
【问题讨论】:
-
要检查是因为你的代码还是配置,你可以从splash中截取页面结果并检查它,或者如果有价格就检查文档树。
-
哦,刚刚看了你的代码,看来你的xpath是错误的。
标签: javascript python scrapy scrapy-splash