【发布时间】:2018-03-01 20:04:23
【问题描述】:
我想知道是否有一种简洁的方法可以排除具有超过 N 个 NaN 的所有列,从该子集中排除一列。
例如:
df = pd.DataFrame([[np.nan, 2, np.nan, 0],
[3, 4, np.nan, 1],
[np.nan, np.nan, np.nan, 5]],
columns=list('ABCD'))
结果:
A B C D
0 NaN 2.0 NaN 0
1 3.0 4.0 NaN 1
2 NaN NaN NaN 5
运行以下命令,我得到:
df.dropna(thresh=2, axis=1)
B D
0 2.0 0
1 4.0 1
2 NaN 5
我想保留“C”列。即,除了在“C”列之外执行此阈值。
这可能吗?
【问题讨论】:
标签: python pandas filtering nan