【发布时间】:2021-12-03 02:14:07
【问题描述】:
我有数据框,我想从数据框列中获取第一个值和最后一个值。
+----+-----+--------------------+
|test|count| support|
+----+-----+--------------------+
| A| 5| 0.23809523809523808|
| B| 5| 0.23809523809523808|
| C| 4| 0.19047619047619047|
| G| 2| 0.09523809523809523|
| K| 2| 0.09523809523809523|
| D| 1|0.047619047619047616|
+----+-----+--------------------+
期望输出首先来自支持列,最后一个值,即x=[0.23809523809523808,0.047619047619047616.]
【问题讨论】:
-
当你说你想要第一个和最后一个值时,你是如何对数据进行排序的,它是按“count”列排序的吗?
标签: apache-spark pyspark apache-spark-sql pyspark-sql