【发布时间】:2015-02-21 19:07:50
【问题描述】:
我正在学习 Hadoop。
我在单个节点上运行 Hadoop。
据我所知,Reducer 在 Mapper 完成后运行(这也很有意义)。
但是当我在 200MB 文件上运行 MapReduce 作业时,Reducer 在 Mapper 完成之前启动。我没有使用任何组合器。
谁能解释一下为什么?
【问题讨论】:
标签: hadoop
我正在学习 Hadoop。
我在单个节点上运行 Hadoop。
据我所知,Reducer 在 Mapper 完成后运行(这也很有意义)。
但是当我在 200MB 文件上运行 MapReduce 作业时,Reducer 在 Mapper 完成之前启动。我没有使用任何组合器。
谁能解释一下为什么?
【问题讨论】:
标签: hadoop
reduce 阶段涉及将数据输出从映射器复制并合并到 reducer。
由于复制和合并中间输出不需要障碍(您不需要等待所有映射器完成),这就是在映射器运行时减速器正在做的事情。
【讨论】: