【发布时间】:2014-03-27 22:25:10
【问题描述】:
我有以下数据格式:
123456786|data1
123456787|data2
123456788|data3
第一列是 main_id。我需要从 txt 文件中删除所有重复的行,但省略 main_id 编号。我该怎么做?
通常我使用这样的 AWK 脚本,但它会找到双行而不省略:
awk '!x[$0]++' $2 > "$filename"_no_doublets.txt #remove doublets
感谢您的帮助。
【问题讨论】:
标签: bash awk text-processing