【发布时间】:2018-01-16 22:21:02
【问题描述】:
谁能告诉我如何将包含字符串的列表转换为 pyspark 中的数据框。我正在使用 python 3.6 和 spark 2.2.1。我刚刚开始学习 Spark 环境,我的数据如下所示
my_data =[['apple','ball','ballon'],['cat','camel','james'],['none','focus','cake']]
现在,我想如下创建一个数据框
---------------------------------
|ID | words |
---------------------------------
1 | ['apple','ball','ballon'] |
2 | ['cat','camel','james'] |
我什至想添加数据中未关联的 ID 列
【问题讨论】:
标签: pyspark pyspark-sql