12,maptask工作机制与maptask并行度与决定机制

12,maptask工作机制与maptask并行度与决定机制

1.准备数据

200MB

2.提交任务程序drive

maptask通过inputformat读取,通过spilt切分了原文件,spilt=blocksize

3.mapper->map(k,v,context)->outputcollector

4.向环形缓冲区写入数据,默认大小为100MB,超过80%开始溢写

5.进行默认的分区排序

6.merge归并排序

相关文章: