【发布时间】:2015-10-19 14:51:25
【问题描述】:
我在 RDD 中有这样的数据:
RDD[((Int, Int, Int), ((Int, Int), Int))]
作为:
(((9,679,16),((2,274),1)), ((250,976,13),((2,218),1)))
我想输出为:
((9,679,16,2,274,1),(250,976,13,2,218,1))
加入 2 个 rdds 后:
val joinSale = salesTwo.join(saleFinal)
我得到了那个结果集。我尝试了以下代码。
joinSale.flatMap(x => x).take(100).foreach(println)
我尝试过 map/flatMap 但做不到。任何想法如何实现这样的场景?提前谢谢..
【问题讨论】:
-
Tuple 没有 flatten 方法。但是您可以使用
productIterator将其展平 - stackoverflow.com/questions/5289408/iterate-over-a-tuple 但是这真的很难看。
标签: scala apache-spark rdd