【发布时间】:2016-09-30 16:08:56
【问题描述】:
我有一个制表符分隔的数据框,最后一列包含嵌套信息,即“|”分隔。请注意,所有行都保持这种嵌套的括号结构,前面有 'REP='
col1 col2 col3 col4
ID1 text text text...REP=(info1|info2|info3)
ID2 text text text...REP=(info1|info2|info3)
我想处理最后一列,以便括号内的所有信息都是一个新列:
col1 col2 col3 col4 newcol newcol2 newcol3
ID1 text text text info1 info2 info3
ID2 text text text info1 info2 info3
我认为 AWK 命令会很有用,但在适当地构建它时遇到了麻烦。任何帮助将不胜感激。
【问题讨论】:
-
REP 之前的那些点真的存在吗,还是代表更多的列?
-
... 表示 col4 中出现在 'REP=' 之前的附加文本
-
“REP”之前有标签吗?