【发布时间】:2019-10-13 09:40:43
【问题描述】:
我的数据框如下:
cola, colb
1, 2
1, 3
2, 1
2, 5
我要加一栏count:
cola, colb, count
1, 2, 1
1, 3, 2
2, 1, 1
2, 5, 2
需要对 colA 进行分组并将第一条记录的计数设置为 1,然后将每个连续的行递增 1。
我尝试使用窗口函数,但它对 colA 中的所有记录应用相同的计数而没有增量。
【问题讨论】:
标签: group-by count pyspark counter pyspark-sql