【发布时间】:2019-12-01 08:06:54
【问题描述】:
我找到了一个从列中检测异常值的函数,但我不知道如何删除异常值
是否有从列中排除或删除异常值的功能
这是检测异常值的函数,但我需要一个函数来删除异常值
import numpy as np
import pandas as pd
outliers=[]
def detect_outlier(data_1):
threshold=3
mean_1 = np.mean(data_1)
std_1 =np.std(data_1)
for y in data_1:
z_score= (y - mean_1)/std_1
if np.abs(z_score) > threshold:
outliers.append(y)
return outliers
这里是打印异常值
#printing the outlier
outlier_datapoints = detect_outlier(df['Pre_TOTAL_PURCHASE_ADJ'])
print(outlier_datapoints)
【问题讨论】: