【发布时间】:2016-07-10 02:08:51
【问题描述】:
假设我使用 df.isnull().sum() 并获得 df 数据帧所有列中所有“NA”值的计数。我想删除 NA 值高于“K”的列。
例如,
df = pd.DataFrame({'A': [1, 2.1, np.nan, 4.7, 5.6, 6.8],
'B': [0, np.nan, np.nan, 0, 0, 0],
'C': [0, 0, 0, 0, 0, 0.0],
'D': [5, 5, np.nan, np.nan, 5.6, 6.8],
'E': [0,np.nan,np.nan,np.nan,np.nan,np.nan],})
df.isnull().sum()
A 1
B 2
C 0
D 2
E 5
dtype: int64
假设我想删除具有 '2' 及以上数量 NA 值的列。将如何解决这个问题?我的输出应该是,
df.columns
A,C
谁能帮我做这件事?
谢谢
【问题讨论】:
-
抱歉,您的意思是
NaN还是字符串 'NA'?此外,您所需的输出与您的数据和对所需结果的解释不匹配 -
@EdChum 对此感到抱歉。我的错。我的意思是 NaN 值。我现在要换 DF。
-
@EdChum 再次为您的困惑感到抱歉。现在改了。
标签: python python-2.7 numpy pandas