【发布时间】:2016-03-14 16:54:01
【问题描述】:
我有一个 Array[RDD[(String, Set[String])]] 类型的 RDD 数组,其中每个 RDD 都是键和值的元组。 键是字符串,值是 Set[String],我想用相同的键合并/联合 Set。我试图在 scala 中做到这一点,但没有快乐。你能帮帮我吗?
e.g.
RDD["A",Set("1","2")]
RDD["A",Set("3","4")]
RDD["B",Set("1","2")]
RDD["B",Set("3","4")]
RDD["C",Set("1","2")]
RDD["C",Set("3","4")]
After transformation:
RDD["A",Set("1","2","3","4")]
RDD["B",Set("1","2","3","4")]
RDD["C",Set("1","2","3","4")]
【问题讨论】:
-
结果必须是 RDD 数组还是带有这些元组的单个 RDD?
-
嗨,它必须是 RDD 数组的结果
标签: scala apache-spark apache-spark-sql