【发布时间】:2018-06-12 19:36:58
【问题描述】:
我想从已导入 hive 表的 .gz 文件中进行查询,但是当我使用一些需要 Map-reduce 作业的查询时,例如: 从测试中选择计数(*); 它显示以下错误:
java.io.IOException: incorrect header check
at org.apache.hadoop.io.compress.zlib.ZlibDecompressor.inflateBytesDirect(Native Method)
at org.apache.hadoop.io.compress.zlib.ZlibDecompressor.decompress(ZlibDecompressor.java:228)
at org.apache.hadoop.io.compress.DecompressorStream.decompress(DecompressorStream.java:111)
at org.apache.hadoop.io.compress.DecompressorStream.read(DecompressorStream.java:105)
我检查并发现 Z LIB 是默认压缩编解码器。 我尝试了 bzip 文件,没问题。 但我如何使用 .gz 文件。 如何更改可以支持 gz 文件的默认编解码器?
【问题讨论】:
-
将此link 用作参考。它可能对您有所帮助。