【发布时间】:2017-02-24 20:07:08
【问题描述】:
通过使用 xpath(.//div[@class="entry-content"]/div/p//text()') 我得到了所有的 text1,text2,.....text6。如何只取"text3","text4","text5","text6"??
`<div class="entry-content">
<div>
<p>
<st>text1</st>
</p>
<p>
<st>text2</st>
</p>
</div>
<p>"text3"</p>
<div>
<p>
<st>"text4"</st>
</p>
<p>
<st>"text5"</st>
</p>
<p>
<st>"text6"</st>
</p>
</div>
</div>`
【问题讨论】:
-
选择背后的逻辑是什么?是要忽略第一个“div”子节点吗?
-
我需要通过避免包含 text1 的前两个
<p>标签来提取 "text3","text4","text5","text6" 和 text2
标签: python python-2.7 python-3.x xpath