awk 使用正则表达式删除子字符串答案

【问题标题】：awk remove substring using regexawk 使用正则表达式删除子字符串
【发布时间】：2015-10-12 19:15:24
【问题描述】：

我有一个管道分隔文件，如下所示：

34ab1 | aaa bbb   ccc   fff  vf | 2015-01-01
35ab1 | aaa bbb   ccc dddefd ddff  ssss   fff  vi | 2015-01-01

我想替换所有以 bbb 开头并以 fff 结尾的内容。

我用过这个：

BEGIN {
    FS = OFS = "|"
}
{
   sub(/[0-9].*[0-9]/, "", $2); sub(/bbb.*fff/, "", $2);
   print
}

数字的正则表达式部分有效，但正则表达式的第二部分没有。

我想要的输出：

34ab1 | aaa   vf | 2015-01-01
35ab1 | aaa   vi | 2015-01-01

【问题讨论】：

【解决方案1】：

对两者使用一个 gsub 函数。

BEGIN {
    FS = OFS = "|"
}
{
gsub(/[0-9].*[0-9]|bbb.*fff/, "", $2);
print
}

【讨论】：