【发布时间】:2021-01-24 00:51:36
【问题描述】:
我在 DATAFRAME 中有这些数据:
id,col
65475383,acacia
63975914,acacia
65475383,excelsa
63975914,better
我想要一个包含“word”列以及与之关联的每个 id 的字典,如下所示:
word:key
acacia: 65475383,63975914
excelsa: 65475383
better: 63975914
我尝试了 groupBy,但这是一种聚合数据的方法,如何解决这个问题?
【问题讨论】:
标签: python sql apache-spark dictionary pyspark