【发布时间】:2014-06-13 13:35:43
【问题描述】:
在 Spark 中,groupByKey 函数将 (K,V) 对 RDD 转换为 (K,Iterable<V>) 对 RDD。
但是,这个功能稳定吗?即迭代中的顺序是否保留了原始顺序?
例如,如果我最初读取的文件格式为:
K1;V11
K2;V21
K1;V12
我对@987654325@ 的可迭代可能像(V12, V11)(因此不保留原始顺序)或者只能是(V11, V12)(因此 保留原来的顺序)?
【问题讨论】:
-
你本质上是在问它是否是一个稳定的排序?
-
是的!没错,我问的是稳定性。
标签: scala apache-spark