【问题标题】:How can I get the data from a css selector using scrapy?如何使用 scrapy 从 css 选择器中获取数据?
【发布时间】:2015-10-27 20:27:30
【问题描述】:

我是 web 和 scrapy 的菜鸟。抱歉这个问题太简单了。

我有这个:item['title'] = response.css('.pt-title a ::title').extract()

我想从中得到标题:

<a href="http://www.heresyodomain.com/" title="Here's the title!">Here's the title!</a>

我正在这样做item['title'] = response.css('.pt-title a::text').extract(),但我意识到我只是得到了不在标签中的文本。

我已经尝试了上面的一些迭代,这只是我离开的最后一个。非常感谢您提供一些指导。

【问题讨论】:

    标签: html css web-scraping scrapy


    【解决方案1】:

    感谢这个问题: python scrapy get href using css selector我有答案了。

    我用过这个:item['title'] = response.css('.pt-title a::attr(title)').extract()

    【讨论】:

      【解决方案2】:

      由于a::text,您的查询选择了a 标记的文本。如果您需要title 的文本,请尝试以下操作:

      item['title'] = response.css('.pt-title a::attr(title)').extract()
      

      最终你会得到一个列表,所以你也应该用item['title'] = response.css('.pt-title a::attr(title)').extract()[0] 来处理它——当然是在正确验证结果之后。

      【讨论】:

        猜你喜欢
        • 1970-01-01
        • 2021-12-22
        • 2014-02-06
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 2018-04-04
        • 1970-01-01
        • 1970-01-01
        相关资源
        最近更新 更多