【发布时间】:2017-10-29 18:54:32
【问题描述】:
我想使用 PySpark 从多个表中透视数据,但我需要以一种奇怪的方式进行。请参阅下面的示例。
原表:
Vehicle_id | Owner_ID | Vehicle_Buy_Date
--------------------------------------------
1 | 1 | 01/01/2015
1 | 2 | 01/10/2014
2 | 1 | 10/10/2016
最终结果:
Vehicle_id | Owner_1_Buy_Date | Owner_2_Buy_Date
------------------------------------------------
1 |01/01/2015 |01/10/2014
2 |10/10/2016 |NULL
我知道这是一个不寻常的问题,因为这主要不是在数据库表上完成的。
有没有办法在 PySpark 中进行这种类型的旋转?
【问题讨论】:
标签: python apache-spark pyspark pivot