【发布时间】:2018-07-08 08:00:07
【问题描述】:
这里是一些示例 HTML
<div class="something">
<p> This is a <b> Paragraph </b> with <a href="/something"> mixed </a> elements
<p> Next paragraph....
</div>
我尝试的是
//div[contains('@class','something')/text()
和
//div[contains('@class','something')/*/text()
和
//div[contains('@class','something')/p/text()
所有这些似乎都跳过了“b”标签和“a”标签。
【问题讨论】:
标签: xpath web-scraping scrapy screen-scraping