【发布时间】:2010-10-31 18:44:52
【问题描述】:
我在尝试使用特定的正则表达式时遇到了一些困难。我正在搜索文档中每个出现的字符串(出于我的目的,我会说它是“mystring”),除了它在标签中的位置,例如
<a href="_mystring_">
不应该匹配,但是
<a href="someotherstring">_mystring_</a>
应该匹配,因为它不在标签内(内部意思是“在 标记内”)我也在使用 .NET 的正则表达式函数。
【问题讨论】:
-
你的意思是你的第二个例子应该不匹配吗?
-
[在此处插入强制性“不要使用正则表达式解析 HTML”答案]
-
robbotic:不,应该匹配。它不在 标记内。我需要在 mystring 上进行替换,但不是当它是标签的一部分时,因为它在顶部示例中。此外,将其加载到 XDocument 或在我的情况下实际上不可行的任何内容中。
-
我也尝试将字符串加载到 XML 文档中,但因为大多数情况下它们不符合规范(未正确关闭、缺少一两个标签等)我不能用