【发布时间】:2016-07-02 12:07:03
【问题描述】:
我是 spark 和 scala 的新手。我想总结 RDD 中存在的所有值。下面是例子。 RDD 是键值对,假设在做一些连接和转换后,RDD 的输出有 3 条记录,如下所示,其中 A 是键:
(A, List(1,1,1,1,1,1,1))
(A, List(1,1,1,1,1,1,1))
(A, List(1,1,1,1,1,1,1))
现在我想将每条记录的所有值与其他记录中的相应值相加,所以输出应该像
(A, List(3,3,3,3,3,3,3))
谁能帮我解决这个问题。有没有可能使用 scala 实现这一点的方法?
提前致谢
【问题讨论】:
-
我尝试将它们全部分组,然后根据位置添加元素....但无法获得所需的结果
标签: scala apache-spark