【发布时间】:2017-12-08 09:49:46
【问题描述】:
我在 spark 数据框中有一列列表。
+-----------------+
|features |
+-----------------+
|[0,45,63,0,0,0,0]|
|[0,0,0,85,0,69,0]|
|[0,89,56,0,0,0,0]|
+-----------------+
如何将其转换为 spark 数据框,其中列表中的每个元素都是数据框中的一列?我们可以假设列表的大小相同。
例如,
+--------------------+
|c1|c2|c3|c4|c5|c6|c7|
+--------------------+
|0 |45|63|0 |0 |0 |0 |
|0 |0 |0 |85|0 |69|0 |
|0 |89|56|0 |0 |0 |0 |
+--------------------+
【问题讨论】:
-
可能类似于this?
-
特征列的数据类型是什么。你能发布你的架构吗?
标签: pyspark apache-spark-sql spark-dataframe pyspark-sql