MapReduce核心思想 (1)分布式的运算程序往往需要分成至少2个阶段。 (2)第一个阶段的MapTask并发实例,完全并行运行,互不相干。 (3)第二个阶段的ReduceTask并发实例互不相干,但是他们的数据依赖于上一个阶段的所有MapTask并发实例的输出。 (4)MapReduce编程模型只能包含一个Map阶段和一个Reduce阶段,如果用户的业务逻辑非常复杂,那就只能多个MapReduce程序,串行运行。 相关文章: 2021-11-26 2022-12-23 2021-11-03 2021-04-13 2021-04-19 2021-04-26 2022-02-21 2021-12-19