【发布时间】:2016-06-06 09:47:20
【问题描述】:
我想知道如何在 hive 外部表中压缩 json 数据。如何做呢? 我已经创建了这样的外部表:
CREATE EXTERNAL TABLE tweets (
id BIGINT,created_at STRING,source STRING,favorited BOOLEAN
)ROW FORMAT SERDE "com.cloudera.hive.serde.JSONSerDe" LOCATION "/user/cloudera/tweets";
我已经设置了压缩属性
set mapred.output.compress=true;
set hive.exec.compress.output=true;
set mapred.output.compression.codec=org.apache.hadoop.io.compress.GzipCodec;
set io.compression.codecs=org.apache.hadoop.io.compress.GzipCodec;
输入文件:测试
{ "id": 596344698102419451, "created_at": "MonApr0101: 32: 06+00002013", "source": "blank", "favorited": false }
之后我将我的 json 文件加载到 hdfs 位置"/user/cloudera/tweets".
但它没有被压缩。
您能告诉我如何在 hive 外部表中进行压缩吗? 有人可以帮我在 hive 外部表中压缩吗?
提前致谢。
【问题讨论】:
标签: hadoop hive cloudera hiveql hadoop-streaming