【发布时间】:2011-05-26 08:56:33
【问题描述】:
提供随机访问 gzip 和 bzip2 档案的工具:
我正在为 7zip 寻找任何类似的解决方案
(目标是离线使用有时巨大的 Wikipedia 转储文件,而无需保留解压缩的副本)
【问题讨论】:
-
有点迂腐,我承认,但真正的目标是避免重新压缩档案,而不是避免解压缩它们? (我希望生成索引需要解压缩存档,尽管是在内存中而不是在磁盘上。)如果您不介意一次性重新压缩阶段,那么您可以使用 7z 重新压缩SOLID 选项已禁用(或设置为一个较小的值),它为您提供了可以随机访问的存档,而无需大量等待。 (国际海事组织,该默认实体选项在更多地方使用。:()
-
我不介意将它们解压缩为创建索引的一次性成本。但我不想重新压缩它们,因为我希望有限的机器(例如上网本)能够在发布时使用未更改的存档文件。重新压缩速度要慢得多,并且占用更多资源,而且重新压缩的存档将不再具有与已发布的匹配的 MD5 校验和。让发布者生成不同格式的档案可能需要一些协商,但我会保留作为最后的手段,在这种情况下,连接许多较小的 7zip 档案可能也可以。
标签: indexing compression large-files 7zip random-access