【发布时间】:2020-04-11 12:35:03
【问题描述】:
我有一个带有相应列的以下输入数据框:
dim1,dim2,tran_clmn,input1,input2
101,201,Y1,1,2
102,202,Y2,2,3
103,203,Y3,3,4
104,204,Y4,4,5
105,205,Y5,5,6
我需要根据列 tran_clmn
将输入数据转置为下面的转置输出dim1,dim2,new_trn_clm,Y1,Y2,Y3,Y4,Y5
101,201,input1,1,,,,
101,201,input2,2,,,,
102,202,input1,,2,,,
102,202,input2,,3,,,
103,203,input1,,,3,,
103,203,input2,,,4,,
104,204,input1,,,,4,
104,204,input2,,,,5,
105,205,input1,,,,,5
105,205,input2,,,,,6
如何实现这种场景?没有聚合选项。是否可以使用 groupBy 和 pivot 方法完成并获得结果?
【问题讨论】:
标签: hadoop pyspark hive pivot-table transpose