【发布时间】:2017-11-26 00:40:53
【问题描述】:
我的 Linux CentOS 7 上确实有一个以下格式的大文本文件。
430004, 331108, 075, 11, 19, Chunsuttiwat Nattika
431272, 331108, 075, 11, 19, Chunsuttiwat Nattika
435979, 335086, 803, 6, 19, ANNI BRENDA
436143, 335151, 545, 4, 23, Agrawal Abhishek
436723, 335387, 386, 2, 19, Bhati Naintara
438141, 325426, 145, 11, 19, Teh Joshua
如果与第二列匹配,我想删除包括原点在内的重复行。
预期输出:
435979, 335086, 803, 6, 19, ANNI BRENDA
436143, 335151, 545, 4, 23, Agrawal Abhishek
436723, 335387, 386, 2, 19, Bhati Naintara
438141, 325426, 145, 11, 19, Teh Joshua
【问题讨论】:
-
如果重复项彼此相邻,如示例所示,那么最好使用的工具是
uniq...查看man uniq几分钟,你就可以做到它 -
@αԋɱҽԃαмєяιcαη,你的文件有多大?显示
wc -l yourfile -
那么,您可以先对其进行排序,然后应用 uniq 命令。在这两种情况下,您都可以跳过第一列...假设您在
,之后确实有这些空格@ -
那么,根据 tow 列中的值,您想删除带有重复 和 原点的行吗?
-
我猜你不需要任何人的帮助..