【发布时间】:2021-03-02 04:07:34
【问题描述】:
我正在尝试使用正则表达式将一堵文本墙拆分为一个数组,它运行良好,但我不希望它删除我正在使用的分隔符。我研究了前瞻功能,但我无法让它正常工作或根本无法工作。
我有以下正则表达式,它在以下组合“Artículo #.”、“Artículo ##.”、1)、2) 等和 a)、b)、c) 以及“Párrafo”一词处拆分。
var result = Regex.Split(text, @"(Artículo)\s[0-9](.)|(Artículo)\s[0-9][0-9](.)|[a-z](\))|[1-9](\))|[1-9][0-9](\))|(Párrafo)", RegexOptions.None);
我需要保留我用来拆分的关键字。例如我有以下文字
Artículo 1. This is a test that includes : 1) Sample text 2) Sample text
最近我得到了:
This is a test that includes :
Sample text
Sample text
我需要什么:
Artículo 1. This is a test that includes :
1) Sample text
2) Sample text
我觉得我快要接近了,但任何帮助都会很棒。
【问题讨论】:
-
除了拆分之外,您还可以使用
Regex.Match和捕获组。这样您就可以遍历匹配项,并查看使用了哪个分隔符