【发布时间】:2021-07-07 00:09:02
【问题描述】:
有没有办法只用一个元素来处理 RDD(这有时会发生在我正在做的事情上)?在这种情况下,reduce 将停止工作,因为该操作需要 2 个输入。
我正在使用键值对,例如:
(key1, 10),
(key2, 20),
我想汇总它们的值,所以结果应该是:
30
但也有rdd只包含单个键值对的情况,所以reduce在这里不起作用,例如:
(key1, 10)
这不会返回任何内容。
【问题讨论】:
标签: apache-spark pyspark rdd reduce