【发布时间】:2018-06-12 19:32:25
【问题描述】:
我有一个数据框:
# +---+--------+---------+
# | id| rank | value |
# +---+--------+---------+
# | 1| A | 10 |
# | 2| B | 46 |
# | 3| D | 8 |
# | 4| C | 8 |
# +---+--------+---------+
我想按值排序,然后排名。这似乎应该很简单,但我没有看到它是如何在文档或 Pyspark 的 SO 中完成的,仅适用于 R 和 Scala。
这是排序后的样子,.show() 应该打印出来:
# +---+--------+---------+
# | id| rank | value |
# +---+--------+---------+
# | 4| C | 8 |
# | 3| D | 8 |
# | 1| A | 10 |
# | 2| B | 46 |
# +---+--------+---------+
【问题讨论】:
标签: apache-spark dataframe pyspark