【发布时间】:2018-03-28 17:17:26
【问题描述】:
a = sc.parallelize((11,7,20,10,1,7))
我想在不使用 sort() 函数的情况下按升序对元素进行排序。
我试过了:
def srt(a,b):
if a>b:
i=a
a=b
b=i
final=a.map(lambda x,y: srt(x,y))
我没有得到所需的结果。
我想得到
(1,7,7,10,11,20)
谢谢。
【问题讨论】:
-
为什么不能使用
sort()?您的代码不起作用,因为rdd.map()是只有一个变量的函数。 -
我只是想了解 map/filter/reduce 在 pyspark 中的工作原理。这就是为什么我试图在没有 sort() 函数的情况下对其进行排序
标签: sorting apache-spark pyspark rdd