【问题标题】:Remove values above/below standard deviation删除高于/低于标准偏差的值
【发布时间】:2020-05-05 11:35:22
【问题描述】:

我有一个由 18 列和 1500 万行组成的数据库,每列中都有异常值,我想删除高于和低于 2 个标准差的值。不过,我的代码似乎没有编辑数据库中的任何内容。

谢谢。

import pandas as pd
import random as r
import numpy as np


 df = pd.read_csv('D:\\Project\\database\\3-Last\\LastCombineHalf.csv')
df[df.apply(lambda x :(x-x.mean()).abs()<(2*x.std()) ).all(1)]
df.to_csv('D:\\Project\\database\\3-Last\\Removal.csv', index=False)

【问题讨论】:

    标签: python python-3.x pandas csv jupyter-notebook


    【解决方案1】:

    可能是因为您没有将结果分配回df

    发件人:

    df[df.apply(lambda x :(x-x.mean()).abs()<(2*x.std()) ).all(1)]
    

    收件人:

    df = df[df.apply(lambda x :(x-x.mean()).abs()<(2*x.std()) ).all(1)]
    

    【讨论】:

      猜你喜欢
      • 2015-10-10
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2022-09-27
      • 1970-01-01
      • 2014-04-27
      相关资源
      最近更新 更多