1. 概述

  1. 压缩概述【3.7】Hadoop数据压缩
  2. 压缩策略和原则
    【3.7】Hadoop数据压缩

2. MR支持的压缩编码

【3.7】Hadoop数据压缩
为了支持多种压缩/解压缩算法,Hadoop 引入了编码/解码器,如下表
【3.7】Hadoop数据压缩
压缩性能的比较
【3.7】Hadoop数据压缩

3.压缩方式选择

  1. Gzip压缩
    【3.7】Hadoop数据压缩
  2. Bzip2压缩
    【3.7】Hadoop数据压缩
  3. Lzo压缩
    【3.7】Hadoop数据压缩
  4. Snappy压缩
    【3.7】Hadoop数据压缩

4.压缩位置选择

压缩可以在MapReduce作用的任意阶段启用
【3.7】Hadoop数据压缩

5.压缩参数配置

要在Hadoop中启用压缩,可以配置如下参数:
【3.7】Hadoop数据压缩
【3.7】Hadoop数据压缩

相关文章: