【发布时间】:2021-06-10 14:19:14
【问题描述】:
我想在不同的 python 列表(维护对应关系)或 python 字典中提取 pyspark 数据帧的所有不同列。
我该怎么做?
我唯一想做的就是-
colA_list = [i.colA for i in df.select("colA").collect()]
colB_list = [i.colB for i in df.select("colB").collect()]
这种方法能确保正确排序吗?如果不是最好的方法是什么?
【问题讨论】: