【发布时间】:2021-03-05 22:15:24
【问题描述】:
从此开始:
items.take(2)
[['home', 'alone', 'apparently'], ['st','louis','plant','close','die','old','age','workers','making','cars','since','onset','mass','automotive','production','1920s']]
type(items)
pyspark.rdd.PipelinedRDD
我想将其转换为 Spark 数据框,其中每个单词列表有一列和一行。
【问题讨论】:
标签: python dataframe apache-spark pyspark rdd