【发布时间】:2018-11-23 02:13:43
【问题描述】:
我在 PySpark 数据框中有大量列,例如 200 列。我想选择除 3-4 列之外的所有列。如何选择这些列而无需手动输入我要选择的所有列的名称?
【问题讨论】:
-
将
drop用于您要排除的列。 -
df.select([c for c in df.columns if c not in {'GpuName','GPU1_TwoPartHwID'}])
标签: python sql dataframe pyspark