【发布时间】:2020-09-16 06:07:16
【问题描述】:
我有一个文件,其中包含三元组形式的图的节点和边。每行有 3 个三元组,但有时中间或末尾有文本:
<samplenode> <sampleEdge> <samplenode>
<samplenode> sometimestheristextinbetween<sampleEdge> <samplenode> and sometimes more at the end
<samplenode> <samplereEdge> <samplenode>
我需要一个只打印三元组并忽略中间文本的命令。所以它应该只包含<>之间的字符
可以包含<和>,也可以不包含。没关系,但应该分开。结果可能如下所示:
<samplenode> <sampleEdge> <samplenode>
<samplenode> <sampleEdge> <samplenode>
<samplenode> <sampleEdge> <samplenode>
我用sed 尝试过,删除了两个模式之间的所有内容(> 和< 之间的所有内容),但它从来没有按照我想要的方式工作。
有人可以帮我解决吗?也许是grep或awk?
问候
【问题讨论】:
-
行尾可以留一个空格吗?
-
<或>可以出现在任何其他上下文中,例如在sometimestheristextinbetween文本中? -
@PaulHodges 是的,没关系。
-
@EdMorton 不,它们不会出现在任何其他上下文中