Linux常用统计命令之sort

sort是在Linux里非常常用的一个统计命令

1 sort的工作原理

sort将文件的每一行作为一个单位，相互比较，比较原则是从首字符向后，依次按ASCII码值进行比较，最后将他们按升序输出。

其语法及常用参数格式：

sort [-bcfMnrtk][源文件][-o 输出文件]

补充说明：sort可针对文本文件的内容，以行为单位来排序。

参　　数：

-b 忽略每行前面开始出的空格字符。

-c 检查文件是否已经按照顺序排序。

-f 排序时，忽略大小写字母。

-M 将前面3个字母依照月份的缩写进行排序。

-n 依照数值的大小排序。

　　 -h 使用易读性数字(例如:2K、1G)排序

-o <输出文件> 将排序后的结果存入指定的文件。

-r 以相反的顺序来排序。

-t <分隔字符> 指定排序时所用的栏位分隔字符。

-k 选择以哪个区间进行排序。

　　　-v 按照版本排序

　　　-u 排序后删除重复行，等价于sort test1 | uniq

sort -h

$ cat sort_h
60MB
10
1000KB
20MB
300KB
5
A
40GB
50KB
$ cat sort_h|sort -h
A
5
10
50KB
300KB
1000KB
20MB
60MB
40GB

View Code

sort -n

$ cat sort_n
01
00
0
70
78
67
23
30
09
44002
32010
32102
5743
3306
$ sort -n sort_n
0
00
01
09
23
30
67
70
78
3306
5743
32010
32102
44002

View Code