【发布时间】:2016-08-21 16:30:12
【问题描述】:
例如,我有下一个 ((i,j), k) 类型的 RDD:
((0,0), 0)
((0,1), 0)
((1,0), 0)
((1,1), 0)
我想将其转换为另一个,如果i==j 则具有1。我的第一次尝试出错了:
rddnew = rdd.flatMap(lambda ((i,j), k): [if i==j: ((i,j), 1)]))
有人可以帮我在 python 中改进这段代码吗?
【问题讨论】:
标签: apache-spark pyspark rdd