Scrapy没有从某个xpath中提取数据答案

【问题标题】：Scrapy not extracting data from a certain xpathScrapy没有从某个xpath中提取数据
【发布时间】：2019-02-04 22:12:50
【问题描述】：

我正在尝试从亚马逊产品页面中提取一些数据。

我正在寻找的是从产品中获取图像。例如：

通过使用 XPath

//script[contains(., "ImageBlockATF")]/text()

我得到了包含 url 的源代码部分，但 chrome XPath 帮助器中弹出了 2 个选项。

通过使用 XPath 进行尝试，我最终使用了这个：

//*[contains(@type, "text/javascript") and contains(.,"ImageBlockATF") and not(contains(.,"jQuery"))]

它专门为我提供了我需要的数据。

我遇到的问题是，对于某些产品（它可能发生在 2 双不同的鞋子内），有时我可以提取数据，而其他时候什么都没有。我通过这样做来提取：

imagenesString = response.xpath('//*[contains(@type, "text/javascript") and contains(.,"ImageBlockATF") and not(contains(.,"jQuery"))]').extract()

如果我使用 chrome xpath 帮助程序，数据总是与上面的 xpath 一起出现，但在程序本身中有时会出现，有时不会出现。我知道有时控制台读取的脚本与网站上显示的脚本不同，但我正在努力解决这个问题，因为有时它可以工作，有时它不能。对可能发生的事情有任何想法吗？

【问题讨论】：

【解决方案1】：

我想我发现了你的问题：它是一个验证码。

按照以下步骤重现：

scrapy shell https://www.amazon.com/gp/product/B072L7PVNQ?pf_rd_p=1581d9f4-062f-453c-b69e-0f3e00ba2652&pf_rd_r=48QP07X56PTH002QVCPM&th=1&psc=1

view(respone)

执行此操作时，我有时会收到验证码。希望这能为您指明正确的方向。

干杯

【讨论】：