【发布时间】:2015-12-29 18:03:37
【问题描述】:
我正在尝试计算文本文件第 3 列中数字的唯一出现次数,这是一个非常简单的命令:
awk 'BEGIN {FS = "\t"}; {print $3}' bisulfite_seq_set0_v_set1.tsv | uniq -c
应该是这样的
1 10103
2 2093
3 109
而是提出了废话,其中多次计算相同的数字,例如
20 1
1 2
1 1
1 2
14 1
1 2
我也试过
awk 'BEGIN {FS = "\t"}; {print $3}' bisulfite_seq_set0_v_set1.tsv | sed -e 's/ //g' -e 's/\t//g' | uniq -c
我已经尝试了 uniq 手册页中我能想到的所有组合。如何使用 uniq 正确计算数字的唯一出现次数?
【问题讨论】: