【问题标题】:xPath doesn't retrieve HTML as part of the contentxPath 不检索 HTML 作为内容的一部分
【发布时间】:2010-09-01 05:17:11
【问题描述】:

我在 xPath 的帮助下解析网页并检索 div 元素的内容,它忽略了包含在该 div 元素中的 HTML。如何让它检索包含 HTML 的 div 元素的全部内容?

【问题讨论】:

  • 查看我的回答,详细解释导致这种结果的原因。最好提供一个特定的 XML 文档(尽可能短)和使用的特定 XPath 表达式——这样人们就不必猜测了。

标签: php xpath


【解决方案1】:

使用

someExprSelectingtheDiv/node()

这将选择在表达式的第一个定位步骤中选择的divs 的所有子节点(标记和文本)。

不要使用任何选定元素的string() 值,因为这只是该元素的串联(按文档顺序)文本后代。

此外,节点集的字符串值是该节点集的第一个节点(按文档顺序)的字符串值。

这些信息应该足以解释在评估有问题的 XPath 表达式时观察到的行为。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2016-05-15
    • 2018-09-04
    • 2011-11-01
    • 1970-01-01
    • 1970-01-01
    • 2020-05-15
    • 2016-01-13
    • 2013-04-01
    相关资源
    最近更新 更多