【发布时间】:2016-05-29 21:32:32
【问题描述】:
我有一个这种数据类型的 Spark RDD:RDD[(Int, Array[Int])])
该 RDD 的示例值为:
100, 数组(1,2,3,4,5)
200,数组(1,2,50,20)
300, 数组(30,2,400,1)
我想获取所有 Array 元素中的所有唯一值 这个RDD的我不关心密钥,只想得到所有的 独特的价值观。所以上述样本的结果是 (1,2,3,4,5,20,30,50,400)。
什么是有效的方法。
【问题讨论】:
标签: scala apache-spark