使用 sed 删除 '#' 后的字符串答案

【问题标题】：Delete string after '#' using sed使用 sed 删除 '#' 后的字符串
【发布时间】：2019-08-26 08:30:32
【问题描述】：

我有一个看起来像这样的文本文件：

#filelists.txt
a
# aaa
b
#bbb
c #ccc

我想删除以'#'开头的部分行，然后，如果行以#开头，则删除整行。

所以我在 shell 中使用 'sed' 命令：

sed -e "s/#*//g" -e "/^$/d" filelists.txt

我希望它的结果是：

a
b
c

但实际结果是：

filelists.txt
a
 aaa
b
bbb
c ccc

我的“sed”命令出了什么问题？

我知道 '*' 表示“任何”，所以我认为 '#*' 表示“#”之后的字符串。

不是吗？

【问题讨论】：

标签： sed

【解决方案1】：

你可以使用

sed 's/#.*//;/^$/d' file > outfile

s/#.*// 删除 # 和该行的所有其余部分，/^$/d 删除空行。

s="#filelists.txt
a
# aaa
b
#bbb
c #ccc"

sed 's/#.*//;/^$/d' <<< "$s"

输出：

a
b
c

另一个想法：匹配具有# 的行，然后删除# 和该行的其余部分，如果该行为空，则删除：

sed '/#/{s/#.*//;/^$/d}' file > outfile

这样，您可以保留原来的空行。

【讨论】：

【解决方案2】：

* 并不意味着“任何”（至少在正则表达式上下文中不是）。 * 表示“零个或多个前面的模式元素”。这意味着您正在删除“零个或多个#”。因为你只有一个#，你把它删了，剩下的那行就原封不动了。

您需要s/#.*//：“删除# 后跟零个或多个任意字符”。

编辑：建议grep -v，但没有注意到第三个示例（行中间的#）。

【讨论】：