【发布时间】:2015-12-31 21:37:00
【问题描述】:
我刚刚使用 Hadoop 0.20.205 设置了一个 Hadoop 集群。我有一个主机(NameNode 和 JobTracker)和另外两个盒子(从机)。
我试图了解,如何定义要使用的 map 和 reduce 任务的数量。
到目前为止,我了解到我可以设置每个 TaskTracker 能够同时处理的最大 map 和 reduce 任务数:*mapred.tasktracker.map.tasks.maximum* 和 *mapred.tasktracker.reduce.tasks.maximum*。
另外,我可以定义整个集群可以与*mapred.map.tasks* 同时运行的最大地图任务数。对吗?
如果是这样,我怎么知道*mapred.tasktracker.map.tasks.maximum* 的值应该是多少?我看到默认值为 2。但是为什么呢?增加或减少这个值有什么好处和坏处?
【问题讨论】: