【发布时间】:2017-08-04 19:12:06
【问题描述】:
使用 pyspark,我希望能够对 spark 数据框进行分组,对组进行排序,然后提供行号。所以
Group Date
A 2000
A 2002
A 2007
B 1999
B 2015
会变成
Group Date row_num
A 2000 0
A 2002 1
A 2007 2
B 1999 0
B 2015 1
【问题讨论】:
-
为什么这么讨厌?
-
不幸的是,问题必须包含您自己测试过的代码(并且不起作用)的错误印象,尽管根据 SO 询问指南,这是当然不是的情况:stackoverflow.com/help/on-topic
标签: apache-spark pyspark apache-spark-sql spark-dataframe pyspark-sql