【发布时间】:2012-04-29 09:26:39
【问题描述】:
我正在使用 xpath,我正在尝试从如下所示的链接中获取锚文本:
<a href="http://link.com"><b>anchor</b> text</a>
我尝试使用 xPath 获取锚文本:
.//a/text()
但我只得到“文本”作为结果,而不是“锚文本”。
如何获取全文?
【问题讨论】:
标签: xml parsing xpath html-parsing domxpath
我正在使用 xpath,我正在尝试从如下所示的链接中获取锚文本:
<a href="http://link.com"><b>anchor</b> text</a>
我尝试使用 xPath 获取锚文本:
.//a/text()
但我只得到“文本”作为结果,而不是“锚文本”。
如何获取全文?
【问题讨论】:
标签: xml parsing xpath html-parsing domxpath
.//a/text()
文本节点包含“锚”的原因是因为该文本节点是b 的子节点——不是a 的子节点。上面的表达式只选择作为当前上下文节点后代的任何a 的子节点的文本节点。
使用:
.//a//text()
这将选择作为当前上下文节点后代的所有a 元素的后代的所有文本节点。
【讨论】: