【发布时间】:2012-08-02 22:59:47
【问题描述】:
我有一个 HTML 文档,我想使用 C# 和 XPath 进行查询。我正在寻找的是一个 XPath 表达式——而不是 XSLT、C#、PHP 或任何其他特定于语言的代码示例。任何帮助将不胜感激,但我只需要 XPath 表达式:)。
<tr>
<td>
<p>
<span>text</span>
</p>
</td>
<td>
<p>
<span>text</span>
</p>
</td>
</tr>
<tr>
<td>
<p>
<span>This text is static and will never change</span>
</p>
</td>
<td>
<p>
<span>Bla bla bla .... more bla bla bla</span>
</p>
</td>
</tr>
<tr>
<td>
<p>
<span>text</span>
</p>
</td>
<td>
<p>
<span>text</span>
</p>
</td>
</tr>
我正在寻找的 XPath 表达式将提取当前由字符串实例“Bla bla bla .... more bla bla bla”表示的文本。这个文本会因 HTML 文档而异,但一个字符串总是相同的。在这种情况下,该字符串表示为“此文本是静态的,永远不会改变”。
“此文本是静态的,永远不会改变”和“Bla bla bla .... more bla bla bla”当然不是真正的字符串 - 我替换了它们,因为它们是特定于域的,与问题无关,并且它们揭示了不得显示的敏感数据!
再次,我们将不胜感激任何帮助。谢谢。
【问题讨论】:
-
使用什么语言——PHP? JavaScript?仅 HTML 无法做到这一点。请编辑问题以标记语言。
-
@Utkanos:XPath 表达式与语言无关。
-
我知道这一点,但他/她将用某种语言实现它。他/她已将其重新标记为 C#。
-
不一定。
xmlstarlet等工具采用原始 XPath 表达式。 -
如果您知道要查找的文本,为什么还要从文档中提取它?