【发布时间】:2021-10-06 05:22:05
【问题描述】:
如何过滤 pyspark 数据帧但仍然是数据帧格式?
我用过这个
datalabel = datalabel.filter(datalabel.subs_no.isNotNull()).collect()
但datalabel 格式改为列表。
【问题讨论】:
-
你的问题很模糊
-
datalabel.filter(datalabel.subs_no.isNotNull())会返回一个数据框。当您在其上调用.collect()时,您正在请求行列表。所以只需删除.collect()
标签: python pandas dataframe pyspark