【发布时间】:2020-12-24 05:24:50
【问题描述】:
我有一个包含 3 个数值变量的数据框,我试图将异常值限制在 0.01 到 0.99 个百分位数之间,但它不起作用。
df[['TotalVisits', 'Total Time Spent on Website',
'Page Views Per Visit']].describe(percentiles=[.25, .5, .75, .90, .95, .99])
现在我尝试将异常值限制为:
q_l = df['TotalVisits'].quantile(0.00)
q_h = df['TotalVisits'].quantile(0.99)
df['TotalVisits'][df['TotalVisits']<= q_l] = q_l
df['TotalVisits'][df['TotalVisits']>= q_h] = q_h
但输出保持不变,而不是最大值变为 17。
【问题讨论】:
标签: python-3.x pandas outliers