Scrapy 1.0.3 抓取的数据具有使用 xpath 和 extract() 的 <value> 标记答案

【问题标题】：Scrapy 1.0.3 scraped data has <value> tags using xpath and extract()Scrapy 1.0.3 抓取的数据具有使用 xpath 和 extract() 的 <value> 标记
【发布时间】：2015-09-08 02:18:58
【问题描述】：

我有一些抓取代码，假设可以抓取某些页面中嵌入的 youtube 视频。

示例：

item['video'] = response.xpath['//div[@class="imobile-body"]/iframe').extract()

但是，当我输出到 xml 时，“视频”标签还将包含“值”标签以及抓取的数据。

我不想要那里的值标签，有没有办法不将它包含在抓取的数据中？

我知道extract()[0] 有效，但有时会抓取多个视频，我不想再添加其他视频。

我该如何纠正这个问题？

我也是一个新手python程序员。

【问题讨论】：

您能提供一个包含“value标签”的示例数据吗？
我自己解决了这个问题 ''.join(response.xpath['//div[@class="imobile-body"]/iframe').extract())
@hooliooo，您可以决定要么删除自己的问题，要么自己回答，以便其他面临相同问题的人知道如何解决。

标签： python xml xpath web-scraping scrapy

【解决方案1】：

我自己通过 ''.join(response.xpath['//div[@class="imobile-body"]/iframe').extract()) 解决了这个问题

【讨论】：