【发布时间】:2010-09-01 05:17:11
【问题描述】:
我在 xPath 的帮助下解析网页并检索 div 元素的内容,它忽略了包含在该 div 元素中的 HTML。如何让它检索包含 HTML 的 div 元素的全部内容?
【问题讨论】:
-
查看我的回答,详细解释导致这种结果的原因。最好提供一个特定的 XML 文档(尽可能短)和使用的特定 XPath 表达式——这样人们就不必猜测了。
我在 xPath 的帮助下解析网页并检索 div 元素的内容,它忽略了包含在该 div 元素中的 HTML。如何让它检索包含 HTML 的 div 元素的全部内容?
【问题讨论】:
使用:
someExprSelectingtheDiv/node()
这将选择在表达式的第一个定位步骤中选择的divs 的所有子节点(标记和文本)。
不要使用任何选定元素的string() 值,因为这只是该元素的串联(按文档顺序)文本后代。
此外,节点集的字符串值是该节点集的第一个节点(按文档顺序)的字符串值。
这些信息应该足以解释在评估有问题的 XPath 表达式时观察到的行为。
【讨论】: