【发布时间】:2015-09-08 02:18:58
【问题描述】:
我有一些抓取代码,假设可以抓取某些页面中嵌入的 youtube 视频。
示例:
item['video'] = response.xpath['//div[@class="imobile-body"]/iframe').extract()
但是,当我输出到 xml 时,“视频”标签还将包含“值”标签以及抓取的数据。
我不想要那里的值标签,有没有办法不将它包含在抓取的数据中?
我知道extract()[0] 有效,但有时会抓取多个视频,我不想再添加其他视频。
我该如何纠正这个问题?
我也是一个新手python程序员。
【问题讨论】:
-
您能提供一个包含“
value标签”的示例数据吗? -
我自己解决了这个问题 ''.join(response.xpath['//div[@class="imobile-body"]/iframe').extract())
-
@hooliooo,您可以决定要么删除自己的问题,要么自己回答,以便其他面临相同问题的人知道如何解决。
标签: python xml xpath web-scraping scrapy