【发布时间】:2019-01-20 05:03:01
【问题描述】:
假设我有这段代码
df= rn.read_sql(sql,conn)
data = df.as_matrix(['TOT_CLM_GROSS_AMT','Gross_Amt_per_SRV','TOT_CLM_NET_AMT'])
db = DBSCAN(eps=15, min_samples=200).fit(data)
异常值是:
outliers_df= pd.DataFrame(data)
outliers = outliers_df[db.labels_==-1]
我能知道为什么 DBSCAN 会考虑异常值吗?它们的标准是什么?我可以通过 DBSCAN 知道吗?
【问题讨论】:
标签: python scikit-learn cluster-analysis outliers dbscan