【发布时间】:2012-03-18 09:56:57
【问题描述】:
我在 C# 中使用正则表达式有困难。我需要做的是找到一个特定的字符串,并在该字符串中只保留一个特定的单词。
这是我的代码:
reg = new Regex("<td></td><td><Span class=\"abc\"><Span style=\"color:#......;\"><B>(.*?)</td></tr>");
这是我要检索的唯一字符串,因为我可以放不同的颜色......(代码颜色始终为 6 个字符),而 (.*?) 是我将要检索的特定单词想保存。
然后是这样的:
this.varToSave = reg.Match(data).Value.Replace("<td></td><td><Span class=\"abc\"><Span style=\"color:#......;\"><B>", "").Replace("</td></tr>", "");
我想删除所有内容并只保留我的话(。*?),但它不起作用。它只会删除 ("", "")。我认为是替换代码中的“......”有问题,但我不知道如何解决这个问题。
提前致谢。
【问题讨论】:
-
不要使用正则表达式解析 HTML。幽默的解释见stackoverflow.com/a/1732454/960195。
-
如果您不必使用正则表达式,您正在寻找“Web Scraper”吗?也许:stackoverflow.com/questions/4377355/…
-
谢谢你的链接,我会检查出来的。
标签: c#