【发布时间】:2014-09-23 21:28:34
【问题描述】:
当调用 reduceByKey 操作时,它正在接收特定键的值列表。我的问题是:
- 它收到的值列表是否按排序顺序排列?
- 是否有可能知道它收到了多少值?
- 我正在尝试计算reduceByKey 中键值列表的第一个四分位数。这可以在 reduceByKey 中实现吗?
【问题讨论】:
-
我认为你想要 groupByKey,尽管从技术上讲我相信你可以弄乱 reduceByKey 来让它工作
-
我实际上尝试了 groupByKey,但我在这里读到,如果您不通过 RDD 进行下一步处理,效率会降低mail-archives.apache.org/mod_mbox/spark-user/201402.mbox/…
-
没错,它没有那么高效,但这就是它更通用的原因
标签: scala apache-spark rdd