【发布时间】:2021-02-27 13:42:33
【问题描述】:
我一直在使用HDBSCAN,并根据我的数据拥有数百个集群。我正在尝试选择一些集群组进行进一步分析。寻找具有高集群间距离的集群,因为它比集群的其余部分更分散并且表现得有点离群。到目前为止,我正在使用 (-1) 集群类别,但意识到这些集群中的 cluster.probabilities_ 是 0。我需要这个值来做进一步的分析。
我的问题是:
-
cluster.probabilities_score 对集群有何评价? - 还有什么方法(除了选择
-1集群类别)我可以选择其他一些可能存在异常值的集群吗?就像计算集群间距离或其他方式一样?
【问题讨论】:
标签: scikit-learn cluster-analysis unsupervised-learning hdbscan