【发布时间】:2015-06-05 06:15:38
【问题描述】:
您好,我有一个 MR2 作业,它将使用 snappy 压缩的 avro 数据作为输入,对其进行处理并将数据输出到 avro 格式的输出目录中。期望这个输出的 avro 数据也应该被快速压缩,但事实并非如此。 MR 作业是仅地图作业。
我在我的代码中设置了以下属性
conf.set("mapreduce.map.output.compress", "true");
conf.set("mapreduce.map.output.compress.codec", "org.apache.hadoop.io.compress.SnappyCodec");
但输出仍然没有被快速压缩
【问题讨论】:
-
该命令只压缩map阶段的中间输出,不压缩最终输出。
-
但它只是地图工作
标签: hadoop mapreduce hadoop-yarn avro snappy