sort是在Linux里非常常用的一个统计命令
1 sort的工作原理
sort将文件的每一行作为一个单位,相互比较,比较原则是从首字符向后,依次按ASCII码值进行比较,最后将他们按升序输出。
其语法及常用参数格式:
sort [-bcfMnrtk][源文件][-o 输出文件] 补充说明:sort可针对文本文件的内容,以行为单位来排序。
参 数:
-b 忽略每行前面开始出的空格字符。
-c 检查文件是否已经按照顺序排序。
-f 排序时,忽略大小写字母。
-M 将前面3个字母依照月份的缩写进行排序。
-n 依照数值的大小排序。
-h 使用易读性数字(例如:2K、1G)排序
-o <输出文件> 将排序后的结果存入指定的文件。
-r 以相反的顺序来排序。
-t <分隔字符> 指定排序时所用的栏位分隔字符。
-k 选择以哪个区间进行排序。
-v 按照版本排序
-u 排序后删除重复行,等价于sort test1 | uniq
sort -h
$ cat sort_h 60MB 10 1000KB 20MB 300KB 5 A 40GB 50KB $ cat sort_h|sort -h A 5 10 50KB 300KB 1000KB 20MB 60MB 40GB
sort -n
$ cat sort_n 01 00 0 70 78 67 23 30 09 44002 32010 32102 5743 3306 $ sort -n sort_n 0 00 01 09 23 30 67 70 78 3306 5743 32010 32102 44002