【发布时间】:2015-04-21 10:18:41
【问题描述】:
我了解资源管理器将 MapReduce 程序发送到每个节点管理器,以便在每个节点中执行 MapReduce。
但是看到这张图片后,我对实际Map & Reduce jobs 的执行位置以及数据节点之间的洗牌情况感到困惑?
跨不同数据节点对数据进行排序和混洗/发送数据以执行Reduce Job 不是花费时间吗?请解释一下。
还让我知道此图中的Map Node 和Reduce Node 是什么。
图片来源:http://gppd-wiki.inf.ufrgs.br/index.php/MapReduce
【问题讨论】:
-
看看这个link
-
@oftata :该链接解释了 map reduce。但我问 map reduce 发生在哪里?
-
我同意,但 Yahoo 教程的答案中有一个链接可以回答您的问题。
-
@oftata:是的。谢谢。我现在明白了。
标签: hadoop mapreduce hdfs hadoop-yarn