【发布时间】:2021-08-30 23:01:34
【问题描述】:
我有一个如下所示的数据框
+----------+----+----+----+
| date|col1|col2|col3|
+----------+----+----+----+
|2021-05-01| 20| 30| 40|
|2021-05-02| 200| 300| 10|
+----------+----+----+----+
我希望将此数据帧旋转/转置为
+-----+----------+----------+
|col |2021-05-01|2021-05-02|
+-----+----------+----------+
|Col1 | 20| 200|
|Col1 | 30| 300|
|Col1 | 40| 10|
+-----+----------+----------+
this 和 this 等其他 stackoverflow 文章在一定程度上帮助了我,但我已经找到了解决方案。
我的方法是(所有失败的尝试)
scala> dUnion.groupBy("date").pivot("date").agg(first("col1")).show()
+----------+----------+----------+
| date|2021-05-01|2021-05-02|
+----------+----------+----------+
|2021-05-02| null| 200|
|2021-05-01| 20| null|
+----------+----------+----------+
scala> dUnion.groupBy("date", "col1", "col2", "col3").pivot("date").agg(first("col1")).show()
+----------+----+----+----+----------+----------+
| date|col1|col2|col3|2021-05-01|2021-05-02|
+----------+----+----+----+----------+----------+
|2021-05-02| 200| 300| 10| null| 200|
|2021-05-01| 20| 30| 40| 20| null|
+----------+----+----+----+----------+----------+
但我能想到的壁橱是
scala> dUnion.groupBy().pivot("date").agg(first("col1")).show()
+----------+----------+
|2021-05-01|2021-05-02|
+----------+----------+
| 20| 200|
+----------+----------+
【问题讨论】:
-
您正在尝试取消透视。在这里查看我的答案:stackoverflow.com/a/60212279/180650
-
谢谢@Vitaliy。
stack是我要查找的关键字。
标签: scala apache-spark pivot