又一个多行组正则表达式查询答案

【问题标题】：Yet Another MultiLine Group Regex Query又一个多行组正则表达式查询
【发布时间】：2013-03-25 10:31:14
【问题描述】：

所以我正在尝试编写一个正则表达式来过滤特定 sn-ps 的文本文件（寻找速度而不是蛮力）。

我想从每场比赛中得到三样东西：

这是正则表达式（可以在此处找到失败的测试工具 - https://gist.github.com/shiftkey/5236161）：

(?s)code start (?<key>[A-Za-z-]*) (?<language>[A-Za-z]*).*[\n](?<value>.*?)[\n].*end code (?<key>[A-Za-z-]*)

使用这些选项：RegexOptions.Compiled | RegexOptions.ExplicitCapture | RegexOptions.Multiline。

所以一个像这样的文件：

// code start foo csharp
var x = 1;
// end code foo

给我期望值：

但是当我引入第二行的 sn-p 时，我只得到最后一行：

// code start foo csharp
var x = 1;
var y = 2;
// end code foo

代替

让组覆盖多行时我错过了什么？

我查看了 SO 上提出的类似场景，但它们对我的使用不起作用。

【问题讨论】：

标签： c# .net regex

【解决方案1】：

这可以通过改变两个.*s 的贪婪来解决：

(?s)code start (?<key>[A-Za-z-]*) (?<language>[A-Za-z]*).*?[\n](?<value>.*)[\n].*?end code (?<key>[A-Za-z-]*)

阅读语言后的.*一定要少一些贪心，因为我们需要第一个换行后的内容作为sn-p值。但是，用于解析value 的.* 可能更贪婪，因为它不应该在遇到第一个\n 时停止，因此上述模式。

【讨论】：

【解决方案2】：

如果你愿意，你也可以用一些环视的东西来捕捉......

(?<=code\sstart\s)(?<key>\b\w+\b)\s(?<language>\b\w+\b).*\r\n(?<content>(?s).*)(?=\r\n.*end\scode\s\1\s-->)

【讨论】：