【发布时间】:2010-12-08 01:36:03
【问题描述】:
我有这些重复行的文件,其中只有最后一个字段不同:
OST,0202000070,01-AUG-09,002735,6,0,0202000068,4520688,-1,0,0,0,0,0,55
ONE,0208076826,01-AUG-09,002332,316,3481.055935,0204330827,29150,200,0,0,0,0,0,5
ONE,0208076826,01-AUG-09,002332,316,3481.055935,0204330827,29150,200,0,0,0,0,0,55
OST,0202000068,01-AUG-09,003019,6,0,0202000071,4520690,-1,0,0,0,0,0,55
我需要删除第一个出现的行并保留第二个。
我试过了:
awk '!x[$0]++ {getline; print $0}' file.csv
但它没有按预期工作,因为它还删除了不重复的行。
【问题讨论】:
-
您的(近)重复项总是相邻还是可以穿插?
-
它们总是相邻的,因为它们已经是另一个 awk 操作的结果。
标签: unix awk duplicate-data lines