【问题标题】:loop drop columns over number of missing values在缺失值的数量上循环删除列
【发布时间】:2019-04-19 05:55:09
【问题描述】:

我正在尝试创建一个循环来创建一个循环,以帮助我删除任何具有一定数量缺失值的列。有人可以帮我吗?

for col in df:

"""Delete columns with over 200 missing values"""

if df[col].isnull().sum() > 200:
    pd.DataFrame.drop(col)

【问题讨论】:

标签: python for-loop missing-data


【解决方案1】:
for col in df:
    if df[col].isnull().sum() > 200:
        df=df.drop(col)

不要从pd.DataFrame 中删除,而是从df 中删除,并且也可以将其分配回去。

甚至更好:

df=df.dropna(thresh=len(df)-200,axis=1)

【讨论】:

  • @FMmach 记得接受它是否有效 :-),乐于提供帮助,???
  • 很好 :) +1 使用 thresh 参数
  • @jpp 谢谢 :-),我也喜欢 thresh 参数。
猜你喜欢
  • 1970-01-01
  • 2021-06-25
  • 1970-01-01
  • 2020-05-09
  • 2021-02-10
  • 2013-05-03
  • 2014-06-03
  • 2016-07-28
  • 2013-08-16
相关资源
最近更新 更多