【发布时间】:2020-10-15 17:58:03
【问题描述】:
假设我在 pyspark 中有这个:
data = [{"age":1,"count":10},{"age":2,"count":20},{"age":3,"count":30}]
rdd = sc.parallelize( data )
如果“年龄”大于 2,我想让“计数”+ 10。 像这样:
data = [{"age":1,"count":10},{"age":2,"count":20},{"age":3,"count":40}]
如何使用 map reduce 实现这一点?
【问题讨论】:
标签: python apache-spark pyspark