MapReduce核心思想

MapReduce核心思想图鉴
(1)分布式的运算程序往往需要分成至少2个阶段。
(2)第一个阶段的MapTask并发实例,完全并行运行,互不相干。
(3)第二个阶段的ReduceTask并发实例互不相干,但是他们的数据依赖于上一个阶段的所有MapTask并发实例的输出。
(4)MapReduce编程模型只能包含一个Map阶段和一个Reduce阶段,如果用户的业务逻辑非常复杂,那就只能多个MapReduce程序,串行运行。

相关文章:

  • 2021-11-26
  • 2022-12-23
  • 2021-11-03
  • 2021-04-13
  • 2021-04-19
  • 2021-04-26
  • 2022-02-21
  • 2021-12-19
猜你喜欢
  • 2021-12-19
  • 2022-12-23
  • 2021-06-02
  • 2022-12-23
相关资源
相似解决方案