【问题标题】:XPath intersection of two sets两组的 XPath 交集
【发布时间】:2011-12-23 00:52:47
【问题描述】:

我需要从 html 文档中提取所有链接,其中包含文本作为内部元素,而不是对图像的引用。基本上我想为 doc.select("//a/text()") 返回任何内容的树中的所有元素执行 doc.select("//a/attribute::href") 。谢谢!

【问题讨论】:

    标签: xpath


    【解决方案1】:

    您可以在 XPath 中将条件写在方括号中的谓词中,例如//a[text()]/@href 选择至少具有一个文本节点子节点的所有链接 (a) 元素的 href 属性。或者,如果您想确保链接中没有 img 子元素,您可以使用例如//a[not(img)]/@href.

    【讨论】:

      猜你喜欢
      • 2013-07-28
      • 1970-01-01
      • 1970-01-01
      • 2011-08-16
      • 1970-01-01
      • 2011-01-24
      • 2014-07-04
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多