【发布时间】:2019-09-30 20:23:29
【问题描述】:
我有一个带有字段分隔符 #~# 的大文件和类似
的记录bus#~#337007270#~#461692988#~#2019-09-24 01:06:33#~#103
bus#~#337007270#~#461692988#~#2019-09-24 01:06:33#~#115
bus#~#337007270#~#461692988#~#2019-09-24 01:06:33#~#117
bus#~#337007270#~#461692988#~#2019-09-24 01:06:33#~#103 -> repeat of 1st
bus#~#337007270#~#461692988#~#2019-09-24 01:06:33#~#118
bus#~#337007270#~#461692988#~#2019-09-24 01:06:33#~#129
bus#~#337007270#~#461692988#~#2019-09-24 01:06:33#~#130
bus#~#337007270#~#461692988#~#2019-09-24 01:06:33#~#132
bus#~#337007270#~#461692988#~#2019-09-24 01:06:33#~#133
如何处理此文件以记录出现次数如下
bus#~#337007270#~#461692988#~#2019-09-24 01:06:33#~#103#~#2
bus#~#337007270#~#461692988#~#2019-09-24 01:06:33#~#115#~#1
bus#~#337007270#~#461692988#~#2019-09-24 01:06:33#~#117#~#1
bus#~#337007270#~#461692988#~#2019-09-24 01:06:33#~#118#~#1
bus#~#337007270#~#461692988#~#2019-09-24 01:06:33#~#129#~#1
bus#~#337007270#~#461692988#~#2019-09-24 01:06:33#~#130#~#1
bus#~#337007270#~#461692988#~#2019-09-24 01:06:33#~#132#~#1
bus#~#337007270#~#461692988#~#2019-09-24 01:06:33#~#133#~#1
谢谢。
【问题讨论】:
-
看起来最后一个字段是唯一变化的?还是您需要验证所有行是否完全相同?
-
寻找 'sort' 和 'uniq -c' 的工作
-
您应该进行基础研究并做出努力。请显示相关代码并说明您遇到问题的地方。另见Why is the “how to move the turtle in logo” question closed? 和How to create a Minimal, Complete, and Verifiable example。
标签: linux shell unix line-count