sed 提取第二个单词答案

【问题标题】：Sed extract 2nd wordsed 提取第二个单词
【发布时间】：2011-10-11 10:28:49
【问题描述】：

我想知道为什么我这样做时它不起作用：

echo "d_suites/k_val/tests/asm/logs/kf_on_stage1 FAILED 0:00:22 Jul 22 22:33 " | 
    sed 's/[ \t]*\([^ \t]+\)[ \t]+\([^ \t]+\).*/\2/'

但是这个（将 + 更改为 * ）有效：

echo "d_suites/k_val/tests/asm/logs/kf_on_stage1 FAILED 0:00:22 Jul 22 22:33 " |
     sed 's/[ \t]*\([^ \t]*\)[ \t]*\([^ \t]*\).*/\2/'

任何帮助将不胜感激。

【问题讨论】：

【解决方案1】：

Sed 默认不支持+ 通配符。

$ echo "aaabbbccc" | sed "s/a+/XXX/g"
aaabbbccc

您可以使用 -r 标志 (on GNU sed) 或 -E 标志（在 Mac OS X 上，我怀疑是 *BSD sed）启用它，因为这些选项允许使用扩展正则表达式（相反到基本的正则表达式）：

$ echo "aaabbbccc" | sed -E "s/a+/XXX/g"
XXXbbbccc

如果你使用 GNU sed，它 supports 和 + 在基本正则表达式模式下作为转发器，如果你用反斜杠转义它：

$ echo "aaabbbccc" | sed "s/a\+/XXX/g"

【讨论】：

【解决方案2】：

第一个不起作用，因为您需要转义您的 +，如下所示：

echo "d_suites/k_val/tests/asm/logs/kf_on_stage1 FAILED 0:00:22 Jul 22 22:33 " | 
    sed 's/[ \t]*\([^ \t]\+\)[ \t]\+\([^ \t]\+\).*/\2/'

编辑

有关原因的更多信息，请阅读this very informative comment。

【讨论】：

【解决方案3】：

如果你没有完全嫁给 sed，awk 会更易读：

echo "..." | awk '{print $2}'

【讨论】：

【解决方案4】：

已编辑 - 现在指的是[^ \t]

[^ \t]+ 是 1-n 个标签，要求有一个非标签。
[^ \t]* 是 0-n 个标签，不需要成为非标签。

你没有在你的输入字符串中有一个非制表符

【讨论】：