【发布时间】:2020-11-28 20:36:48
【问题描述】:
我正在一个严重不平衡的数据集(95% 1 和 5% 0)上构建二元分类模型。我想删除带有异常值的行,我使用了以下代码:
from scipy import stats
df=df[(np.abs(stats.zscore(df)) < 3).all(axis=1)]
但是,此代码将删除标签为 0 的行。是否有更好的方法可以删除除标签列之外的所有列的异常值行?
【问题讨论】:
标签: python pandas outliers drop