【发布时间】:2014-11-11 01:11:50
【问题描述】:
在 Mapreduce 1 中,Jobtracker 从 NameNode 获取 Block 信息,然后将 Task(最有可能)分配给 Task Tracker,这些 Task Tracker 在与存在 Datablock 的节点相同的节点中可用。在那里可以提高性能。
这是如何在 YARN 中处理的? Application Manager 是否负责从 NameNode 获取块信息?
如果是这样,容器如何分配给那些应用程序主?资源管理器在分配容器时是否考虑了数据块的位置?还是随机分配节点中的任何容器?
【问题讨论】:
标签: hadoop mapreduce hadoop-yarn