【发布时间】:2017-06-08 06:19:07
【问题描述】:
我是 scrapy 的新手。我想从网上抓取一些数据。我得到了如下的 html 文档。
<div class="user-info">
<p class="user-img">
something in p tag
</p>
<em>text</em> data I want
<a href="#">
something in a tag
</a>
</div>
我只想获得我想要的文本数据。但是 text 在标签<em></em> 中。所以如果我使用div[contains(@class, "user-info")]/text(),我只能得到我想要的数据。如果我使用div[contains(@class, "user-info")]/node(),我会得到div.user-info 和div[contains(@class, "user-info")]/node()/text() 中的所有标签。那么问题来了,我怎样才能把text和我想要的数据一起变成我想要的text data?
【问题讨论】:
标签: python xpath web-scraping scrapy selector