【问题标题】:Scrapy 1.0.3 scraped data has <value> tags using xpath and extract()Scrapy 1.0.3 抓取的数据具有使用 xpath 和 extract() 的 <value> 标记
【发布时间】:2015-09-08 02:18:58
【问题描述】:

我有一些抓取代码,假设可以抓取某些页面中嵌入的 youtube 视频。

示例:

item['video'] = response.xpath['//div[@class="imobile-body"]/iframe').extract()

但是,当我输出到 xml 时,“视频”标签还将包含“值”标签以及抓取的数据。

我不想要那里的值标签,有没有办法不将它包含在抓取的数据中?

我知道extract()[0] 有效,但有时会抓取多个视频,我不想再添加其他视频。

我该如何纠正这个问题?

我也是一个新手python程序员。

【问题讨论】:

  • 您能提供一个包含“value标签”的示例数据吗?
  • 我自己解决了这个问题 ''.join(response.xpath['//div[@class="imobile-body"]/iframe').extract())
  • @hooliooo,您可以决定要么删除自己的问题,要么自己回答,以便其他面临相同问题的人知道如何解决。

标签: python xml xpath web-scraping scrapy


【解决方案1】:

我自己通过 ''.join(response.xpath['//div[@class="imobile-body"]/iframe').extract()) 解决了这个问题

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2019-03-17
    • 2013-07-25
    • 1970-01-01
    • 1970-01-01
    • 2020-03-24
    • 1970-01-01
    相关资源
    最近更新 更多