【发布时间】:2018-02-09 17:17:56
【问题描述】:
我有一个Dataset,如下所示
monthYear code
201601 11
201601 12
201601 12
201601 10
201602 null
201602 21
201602 21
201602 21
201603 null
当code 是null 时,我想用上个月出现最多的code 替换它。对于上面的示例,第一个 null 将替换为 12,第二个将替换为 21。
所以结果如下。
monthYear code
201601 11
201601 12
201601 12
201601 10
201602 12
201602 21
201602 21
201602 21
201603 21
我怎样才能做到这一点?
【问题讨论】:
标签: scala apache-spark spark-dataframe