【发布时间】:2014-11-17 09:59:36
【问题描述】:
我有一个如下的火花对 RDD (key, count)
Array[(String, Int)] = Array((a,1), (b,2), (c,1), (d,3))
使用 spark scala API 如何获取一个新的按值排序的 RDD 对?
所需结果:Array((d,3), (b,2), (a,1), (c,1))
【问题讨论】:
-
值中可能有重复吗?如果不是:交换键和值并按键排序,交换回来。
-
是的,值是重复的。
标签: scala apache-spark