【发布时间】:2014-07-24 11:33:18
【问题描述】:
是否有一种压缩工具可以让您将其字典(或类似的)与压缩输出分开输出,以便该字典可以在后续压缩中重复使用?想法是一次性传输字典,或使用远程站点的参考字典,使压缩文件更小以便传输。
我查看了一堆常用压缩工具的文档,但我真的找不到支持它的工具。但最常见的压缩工具并不是直接的字典压缩。
我想象的用法是:
compress_tool --dictionary compressed.dict -o compressed.data uncompressed
decompress_tool --dictionary compressed.dict -o uncompressed compressed.data
为了扩展我的用例,我有一个 500MB 的二进制文件 F 我想通过慢速网络进行复制。单独压缩文件会产生 200MB 的大小,这仍然比我想要的大。但是,我的源文件和目标文件都有一个文件 F',它与 F 非常相似,但差异很大,以至于二进制差异工具不能很好地工作。我在想,如果我在两个站点上压缩 F',然后重新使用有关该压缩的信息来压缩源上的 F,我可能会从传输中消除一些可以使用 F' 在目标上重建的信息。
【问题讨论】:
-
您是如何认为 F 和 F' 相似的?我的意思是您的二进制差异工具确定 F 和 F' 有很大差异,因此压缩字典可能有很大差异。因此,我认为重用字典效果不佳,即使有可以重用它的软件。
-
@ymonad 你说得对,我不知道字典是否相似。我只是感觉 F 和 F' 相似,但二进制差异工具的工作方式与压缩工具不同,所以我正在探索选项。唯一确定的方法是我是否能找到可以做到这一点的工具。
标签: linux compression