【问题标题】:GZIPOutputStream not updating Gzip size bytesGZIPOutputStream 不更新 Gzip 大小字节
【发布时间】:2014-08-21 22:23:27
【问题描述】:

要检索通过 gzip 压缩的文件的未压缩大小,您可以读取最后四个字节。我这样做是为了看看是否有任何文件不是他们应该的大小。如果文件小于应有的大小,我使用此代码附加到文件:

GZIPOutputStream gzipoutput = new GZIPOutputStream
    (new FileOutputStream(file, true));

while ((len=bs.read(buf)) >= 0) {
    gzipoutput.write(buf, 0, len);
}

gzipoutput.finish();
gzipoutput.close();

当然,这会按预期附加到 gzip 文件的末尾。但是,在追加之后,读取 gzip 文件的最后四个字节(以获取未压缩的文件大小)并没有给我预期的结果。我怀疑这是因为使用 GZIPOutputStream 没有正确地将大小字节附加到文件的末尾。

如何修改我的代码以附加正确大小的字节?

编辑

我正在以 little-endian 顺序读取字节,如下所示:

gzipReader.seek(gzipReader.length() - 4);
int byteFour = gzipReader.read();
int byteThree = gzipReader.read();
int byteTwo = gzipReader.read();
int byteOne = gzipReader.read();
// Now combine them in little endian
long size = ((long)byteOne << 24) | ((long)byteTwo << 16) | ((long)byteThree << 8) | ((long)byteFour);

我在想,由于我附加到一个 gzip 文件,它只写入附加的字节而不是总文件大小。这合理吗?

【问题讨论】:

  • GZIPOutputStream 中肯定有代码将未压缩的文件大小写为最后四个字节。我不认为这是你的问题。你是如何读取字节的?可能你的阅读顺序不对。
  • 我正在以 little-endian 顺序读取字节,如下所示:gzipReader.seek(gzipReader.length() - 4); int byteFour = gzipReader.read(); int byteThree = gzipReader.read(); int byteTwo = gzipReader.read(); int byteOne = gzipReader.read(); // Now combine them in little endian long size = ((long)byteOne &lt;&lt; 24) | ((long)byteTwo &lt;&lt; 16) | ((long)byteThree &lt;&lt; 8) | ((long)byteFour); 我在想,因为我要附加到 gzip 文件,所以它只写入附加的字节而不是总文件大小.这合理吗?

标签: java file stream byte gzip


【解决方案1】:

因为我附加到一个 gzip 文件,它只写入附加的字节而不是总文件大小。这合理吗?

不仅合理而且不可避免。看看你的代码。附加的GZIPOutputStream 究竟如何知道文件的先前大小?它只能看到传入的数据和传出的OutputStream.

【讨论】:

  • +1;这是GZIPOutputStream 的假设,即只有流输出的数据表示包含写入其中的字节的有效 GZIP 文件格式。您不能只是附加到预先存在的 GZIP 文件并期望生成的总数是合法的。正如你所说,计算机不是魔法。
  • @MarkPeters 实际上,令我惊讶的是,附加的结果是一个有效的 GZIP 流,除了尾随长度的单词:至少,GZipInputStream 可以一次读取它。显然它可以应付另一个流标头。
  • 所以当我附加到 gzip 文件时,我实际上也附加到了前一个长度单词?我曾经听说只有在 gzip 文件是使用单个流创建的情况下读取长度字才是可靠的——我想当 gzip 文件是使用多个流创建时就是这种情况。谢谢!
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2022-01-06
  • 1970-01-01
相关资源
最近更新 更多