【发布时间】:2014-09-18 23:29:57
【问题描述】:
我了解自定义分区器背后的想法。就我而言,我想将所有相同的单词发送给一个减速器。我知道我可以使用哈希码来做到这一点。
但是,我不确定 Hadoop API 中分区器的语法。
这是签名:
Class Partitioner<KEY,VALUE>
如何选择 Key、Value 类型?另外为什么我需要这里的价值?我不应该只使用密钥并根据某种逻辑返回一个整数(在我的例子中是哈希码)。
有人可以举个例子解释一下吗?
【问题讨论】: