【问题标题】:Is there any advantage of doing .gz.bz2?做.gz.bz2有什么好处吗?
【发布时间】:2016-10-21 23:34:10
【问题描述】:

我注意到我的团队中生成的许多文件都有 .gz.bz2 扩展名。这些是纯文本文件。目标是节省磁盘空间。我尝试了一个实验,在同一组文件上执行 gzip 和 gzip + bzip2:

$ du -h pat0/*
1.6M    pat0/p0_c1.diag.csv.gz
1.5M    pat0/p0_c2.diag.csv.gz
2.3M    pat0/p0_c3.diag.csv.gz
1.8M    pat0/p0_c4.diag.csv.gz
3.0M    pat0/p0_c5.diag.csv.gz
3.2M    pat0/p0_c6.diag.csv.gz
3.0M    pat0/p0_c7.diag.csv.gz
3.0M    pat0/p0_c8.diag.csv.gz

$ du -h pat0.bak/*
1.6M    pat0.bak/p0_c1.diag.csv.gz.bz2
1.5M    pat0.bak/p0_c2.diag.csv.gz.bz2
2.3M    pat0.bak/p0_c3.diag.csv.gz.bz2
1.8M    pat0.bak/p0_c4.diag.csv.gz.bz2
3.0M    pat0.bak/p0_c5.diag.csv.gz.bz2
3.2M    pat0.bak/p0_c6.diag.csv.gz.bz2
3.0M    pat0.bak/p0_c7.diag.csv.gz.bz2
2.9M    pat0.bak/p0_c8.diag.csv.gz.bz2

我没有看到明显的改善。如果没有什么重要的预期,那么做 .gz.bz2 有什么好处?为什么不只是其中一个?

【问题讨论】:

    标签: gzip bzip2


    【解决方案1】:

    您已经做过实验,结果很典型。仅当原始数据高度冗余以至于第一个压缩器的最大压缩能力已饱和时,压缩已压缩的文件才会提供不可忽略的收益。

    如果您打算花时间对这些文件进行 bzip2 压缩,则先解压缩它们,然后再应用 bzip2,您会获得更好的结果。应用 xz 会更好。

    【讨论】:

      猜你喜欢
      • 2017-12-28
      • 2019-01-18
      • 2020-10-29
      • 2011-04-24
      • 1970-01-01
      • 1970-01-01
      • 2014-10-26
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多