【发布时间】:2016-05-05 00:57:43
【问题描述】:
我看到一个关于 XML 文档的类似问题,但我有一个 HTML 文档,想知道它是否同样有效。
我正在尝试遍历许多 HTML 页面并确定是否存在包含文本“text”的 span 元素的任何实例:
//*[@id="all_totals"]/div[1]/div/span[7]//span[text()="Export"]
指向 HTML 图像的链接:http://f.cl.ly/items/290L2v373y3c3P050x2m/Image%202016-05-05%20at%202.59.25%20PM.png
在上面的 Xpath 中,我想要的父元素在第二个“div”处结束。我添加了其余的 ("/span[7]...") 作为我要抓取的特定元素。我想检查父元素中包含的任何跨度是否包含文本“文本”,因为如果它们中的任何一个包含,我想要的跨度元素将是 [6] 而不是 [7](“文本”跨度是偶尔发生的额外事件,发生在我想要导致 1 个位置的正增长之前)
我确定我做错了,因此非常感谢任何帮助。
希望这是有道理的。如果需要,很高兴澄清更多!
【问题讨论】:
-
您能否提供您尝试解析的源文档的示例或链接?
-
确实,问题正文中的最小样本优于链接,链接会随着时间的推移而改变或中断。
-
这是我正在使用的 HTML 代码的链接:f.cl.ly/items/290L2v373y3c3P050x2m/… 这是一个链接,因为我想包含大量代码,以提供最完整的图片。