【发布时间】:2023-04-10 20:03:01
【问题描述】:
让我们说,我们有这个。
val sx = sc.parallelize(Array((0, 39), (4, 47), (3, 51), (1, 98), (2, 61)))
我们后来称之为。
val sy = sx.sortByKey(true)
这会让
sy = RDD[(0, 39), (1, 98), (2, 61), (3, 51), (4, 47)]
然后我们做
collected = sy.map(x => (x._2 / 10, x._2)).collect
我们总是会得到以下结果吗?我的意思是,尽管更改了键值,但是否会保留原始键顺序?
collected = [(3, 39), (9, 98), (6, 61), (5, 51), (4, 47)]
【问题讨论】:
标签: scala hadoop apache-spark bigdata