【发布时间】:2019-04-17 08:35:04
【问题描述】:
我有一个如下所示的 Pyspark 数据框。
Time A B C D
06:37:14 2 3 4 5
我想为所有行将其转换为这样。我不想使用 Pandas 来完成这项工作。新的列类型应该是列表类型。
Time Features
06:37:14 [2,3,4,5]
如何使用 Pyspark 做到这一点?
【问题讨论】:
-
如果您有预定义的列数,您可以简单地连接这些值
标签: pyspark