一、mapreduce编程模型
- 一种分布式计算模型。
- MapReduce将这个并行计算过程抽象到两个函数。
- Map(映射):对一些独立元素组成的列表的每一个元素进行指定的操作,可以高度并行。
- Reduce(化简 归约):对一个列表的元素进行合并。
- 一个简单的MapReduce程序只需要指定map()、reduce()、input和output,剩下的事由框架完成。
-
![[1] - Mapreduce概述 [1] - Mapreduce概述](/default/index/img?u=L2RlZmF1bHQvaW5kZXgvaW1nP3U9YUhSMGNITTZMeTl3YVdGdWMyaGxiaTVqYjIwdmFXMWhaMlZ6THpnNU55OWhORGsxWVdJMllUazJaV1UzWVdReU9HRXdOemxoWkRnek9UVmxPREl5T1M1d2JtYz0=)
二、mapreduce名词解释
- Job :用户的每一个计算请求称为一个作业。
- Task:每一个作业,都需要拆分开了,交由多个主机来完成,拆分出来的执行单位就是任务。
- Task又分为如下三种类型的任务:
- Map:负责map阶段的整个数据处理流程
- Reduce:负责reduce阶段的整个数据处理流程
- MRAppMaster:负责整个程序的过程调度及状态协调
-
相关文章:
-
2022-01-25
-
2022-12-23
-
2021-12-22
-
2021-11-05
-
2021-12-06
-
2021-12-10
-
2021-09-03
猜你喜欢
-
2021-12-14
-
2021-08-26
-
2021-09-03
相关资源
-
下载
2021-06-30
-
下载
2023-01-31
-
下载
2023-01-08