【发布时间】:2014-02-28 09:30:06
【问题描述】:
我有一个包含制表符分隔列的文件。我想计算列中的唯一条目。但是,我想仅根据列中的输入来计算唯一性,并删除括号内的任何后续标记。
表格如下所示:
1 abc def xxx(sd) 5677
2 ddd hhh yyy(dd) 4321
3 fds ggf xxx(df) 5666
现在我想计算 xxx 和 yyy 计算的唯一次数
所以预期的输出应该是2,而我得到的是3。
我使用的代码是:
cut -f4 f.txt| sort| uniq -D |wc -l
【问题讨论】:
-
请注意,
sort有一个-k选项,可让您按输入的指定部分进行排序,无需先输入cut。 -
我不明白这会给 3. 当我运行它时,在更正
cut命令后,它是 0,因为第四列对于所有行都是唯一的。 -
列中要计算的唯一条目的字符数可能会有所不同。所以我想计算所有可能的条目,只要它们是唯一的。
-
首数也是一列
标签: sorting unix grep cut uniq