【发布时间】:2020-05-05 11:35:22
【问题描述】:
我有一个由 18 列和 1500 万行组成的数据库,每列中都有异常值,我想删除高于和低于 2 个标准差的值。不过,我的代码似乎没有编辑数据库中的任何内容。
谢谢。
import pandas as pd
import random as r
import numpy as np
df = pd.read_csv('D:\\Project\\database\\3-Last\\LastCombineHalf.csv')
df[df.apply(lambda x :(x-x.mean()).abs()<(2*x.std()) ).all(1)]
df.to_csv('D:\\Project\\database\\3-Last\\Removal.csv', index=False)
【问题讨论】:
标签: python python-3.x pandas csv jupyter-notebook