Hadoop分割与读入文件的方式被定义在一个InputFormat的实现中,默认的实现是TextInputFormat;想读取一行内容,但是没有确定键值,这个实现类会将字节偏移作为键值。

Chpater03 Hadoop组件(三) Hadoop读写

如果需要自定义InputFormat,就必须实现接口,如下

Chpater03 Hadoop组件(三) Hadoop读写

OutputFormat格式

Chpater03 Hadoop组件(三) Hadoop读写

OutputFormat的主要实现类

Chpater03 Hadoop组件(三) Hadoop读写


相关文章: