【发布时间】:2014-04-04 04:45:26
【问题描述】:
在 Map Reduce 编程中,reduce 阶段包含 shuffle、sorting 和 reduce 作为其子部分。排序是一件昂贵的事情。
Map Reduce编程中reducer中shuffle和sort阶段的目的是什么?
【问题讨论】:
-
我一直认为这是必要的,因为 mapper 的输出是 reducer 的输入,所以它根据 keyspace 进行排序,然后为每个 reducer 输入拆分成桶。
标签: sorting hadoop mapreduce hdfs shuffle