【问题标题】：Get first n characters of a regex match获取正则表达式匹配的前 n 个字符
【发布时间】：2015-09-20 02:14:12
【问题描述】：

我想从此正则表达式中获取匹配的第一个 n 字符：

(\d+\s*)

基本上我想用空格右填充。所以在这些行中：

12345␢␢␢␢␢␢␢␢123␢␢␢␢␢␢␢
123␢␢␢␢␢␢␢␢␢12345␢␢␢␢␢␢

我想结束：

12345␢␢␢␢␢123␢␢␢␢␢␢␢
123␢␢␢␢␢␢␢12345␢␢␢␢␢

一行总是有两个匹配项，并且这些行的长度是恒定的。

【问题讨论】：

【解决方案1】：

多次传球

根据有关问题的额外信息及其结构，我建议采取以下步骤：

意思是这样的：

将^(\d*\s*)(\d*\s*)$ 替换为$1\r\n$2。如果您不在 Windows 上，只需删除 \r，我对此表示怀疑。您也许应该考虑在行尾添加一个宏。这应该是文档其余部分未包含的内容（例如#）。 $1 表示替换第一个捕获的组（括号内的内容）。所以用$1#\r\n$2替换它。
现在获取每行所需的长度：(^.{n}).*(#?) 并替换为$1$2。这将捕获第一个 n 符号并在找到时插入宏。
删除宏后的换行符：#\r\n。删除这些或将其替换为 \0。

备注

单程

这里也可以单次通过。

^(\d[\d\s]{n-1})[^\d]*(\d[\d\s]{n-1}).*$

匹配这些行，如果您提取第一组和第二组，这将从文件中过滤所需的输出。只需将其替换为$1$2。

【讨论】：

【解决方案2】：

替换：

(\d[\d\s]{n-1})\s*

与：

$1

这将替换一个数字，后跟 n-1 数字或空白字符，然后是任意数量的空白字符，然后是匹配的第一个 n 字符（因此每行应该有 2 个匹配项）。

【讨论】：