【发布时间】:2013-07-02 15:13:53
【问题描述】:
我注意到所有 map 和所有 reduce 任务都在单个节点 (node1) 上运行。我尝试创建一个由位于 node2 上的单个 hdfs 块组成的文件。当运行一个 mapreduce 任务时,它的输入只包含驻留在 node2 上的这个块,该任务仍然在 node1 上运行。我的印象是 hadoop 优先考虑在包含输入数据的节点上运行任务。我在日志文件中没有看到任何错误报告。知道这里可能会发生什么吗?
我有一个运行在 kvm 上的 3 节点集群,这是按照 cloudera cdh4 分布式安装指南创建的。
【问题讨论】:
-
你怎么知道你的块驻留在 node2 上?您使用的是哪个调度程序?