【发布时间】:2023-03-13 19:38:01
【问题描述】:
在 sklearn kmeans 聚类之后,有什么简单的方法可以返回最远的异常值吗?
基本上,我想为大量集群列出最大的异常值。不幸的是,由于分配,我需要使用 sklearn.cluster.KMeans。
【问题讨论】:
-
展示一些自己的尝试和想法。这里甚至没有一行代码!你所需要的只是
X、kmeans.cluster_centers_、kmeans.labels_(文档中的属性)和一些 numpy(如np.argsort等)。 -
是的,我就是这样做的,我的意思是有一个函数可以用来返回距离而不是之后计算它们
-
你应该提到并展示它!有
kmeans.inertia_(它是平方的!)。阅读文档有什么问题? -
inertia_给出了平方距离的总和,这在这里似乎没有太大帮助;KMeans.transform()给出了各个距离。
标签: python scikit-learn cluster-analysis