【发布时间】:2013-06-12 20:54:17
【问题描述】:
我正在使用 XPath 查询 HTML 文档,其中有以下 div 有文本:
<div class="h1">2008 Honda Accord Coupe<small> — Wuse II</small></div>
我只想获取<div class="h1">2008 Honda Accord Coupe 的内部文本,而不包括<small>inner text</small>
我正在执行以下 XPath 查询://div[@class='h1'],它肯定会返回整个 <div>...</div> 节点。
如果没有<small>...</small>,我怎样才能只获取部分
谢谢
【问题讨论】:
-
除非您没有指定您使用的 XML 解析器,否则这很难说。例如。使用 SimpleXML,您只需将该元素转换为字符串即可。使用 DOMDocument,您可以查询文本节点,如 One Trick Pony 所示。但正确的答案是:这取决于您使用的库/解析器。你不说是哪一个,所以很难回答,因为缺少信息。