【发布时间】:2020-09-25 21:52:44
【问题描述】:
我有一个巨大的 ASCII 文件:
235M Apr 16 06:50 file
我做了以下步骤:
cat file > file_all
cat file >> file_all
470M Apr 16 06:51 file_all
file_1_2 的大小是 2 * file_1 的大小 = 470
我使用zip压缩命令压缩file_1和file_all:
25M Apr 16 06:08 file_all.gz
49M Apr 16 06:25 file_all.gz
据我了解,压缩算法有以下概念:
ZIP 压缩基于要压缩的数据中的重复模式 压缩,并且文件越长压缩越好,如 可以找到和使用更多更长的模式。
问题
为什么我不能利用重复? 1 Mega 是唯一的好处吗?
P.S: 我对 bz2 做了同样的过程,同样的注解【区别只是压缩后的大小本身】 谢谢
【问题讨论】:
标签: compression