【发布时间】:2018-05-07 01:11:21
【问题描述】:
我已根据我的要求实施了二次排序。但我需要弄清楚它的内部工作原理。
鉴于排序发生在地图一侧。我假设溢出文件中的所有 (k,V) 对都是按键排序的。在我们的例子中,复合键。
我想知道来自许多映射文件的属于同一键的值如何以特定顺序(在 SortComparator 中指定)以减少每次的功能。
如果排序发生在 map 端,合并发生在 reducer 端。在 reduce 函数开始之前,许多 map 文件中属于 key 的值如何以及何时按特定顺序排列?
【问题讨论】:
标签: java hadoop mapreduce bigdata reducers