如何使用 scrapy 从 css 选择器中获取数据？答案

【问题标题】：How can I get the data from a css selector using scrapy?如何使用 scrapy 从 css 选择器中获取数据？
【发布时间】：2015-10-27 20:27:30
【问题描述】：

我是 web 和 scrapy 的菜鸟。抱歉这个问题太简单了。

我有这个：item['title'] = response.css('.pt-title a ::title').extract()

我想从中得到标题：

<a href="http://www.heresyodomain.com/" title="Here's the title!">Here's the title!</a>

我正在这样做item['title'] = response.css('.pt-title a::text').extract()，但我意识到我只是得到了不在标签中的文本。

我已经尝试了上面的一些迭代，这只是我离开的最后一个。非常感谢您提供一些指导。

【问题讨论】：

【解决方案1】：

感谢这个问题： python scrapy get href using css selector我有答案了。

我用过这个：item['title'] = response.css('.pt-title a::attr(title)').extract()

【讨论】：

【解决方案2】：

由于a::text，您的查询选择了a 标记的文本。如果您需要title 的文本，请尝试以下操作：

item['title'] = response.css('.pt-title a::attr(title)').extract()

最终你会得到一个列表，所以你也应该用item['title'] = response.css('.pt-title a::attr(title)').extract()[0] 来处理它——当然是在正确验证结果之后。

【讨论】：