【发布时间】:2019-06-10 12:52:59
【问题描述】:
我有这样的数据框 名称状态
+----+------+
|name|value |
+----+------+
| x | down|
| y |normal|
| z | down|
| x |normal|
| y | down|
+----+------+
如果名称相同,我想像这样输入数字 1,2,3,新列必须是这样的
+----+------+------+
|name|value |newCol|
+----+------+------+
| x|down | 1|
| y|normal| 2|
| z|down | 3|
| x|normal| 1|
| y|down | 2|
+----+------+------+
win = Window.partitionBy("name").orderBy("name")
print("value")
dp_df_classification_agg_join = dp_df_classification_agg_join.withColumn("newCol",count("name").over(win))
【问题讨论】:
-
...好的。你有问题吗?
-
请提供您的代码以及您为实现这一目标所做的工作
-
我编辑我的问题