【问题标题】:HDBSCAN Cluster choiceHDBSCAN 集群选择
【发布时间】:2021-02-27 13:42:33
【问题描述】:

我一直在使用HDBSCAN,并根据我的数据拥有数百个集群。我正在尝试选择一些集群组进行进一步分析。寻找具有高集群间距离的集群,因为它比集群的其余部分更分散并且表现得有点离群。到目前为止,我正在使用 (-1) 集群类别,但意识到这些集群中的 cluster.probabilities_0。我需要这个值来做进一步的分析。

我的问题是

  1. cluster.probabilities_ score 对集群有何评价?
  2. 还有什么方法(除了选择-1 集群类别)我可以选择其他一些可能存在异常值的集群吗?就像计算集群间距离或其他方式一样?

【问题讨论】:

    标签: scikit-learn cluster-analysis unsupervised-learning hdbscan


    【解决方案1】:
    1. cluster.probabilities_ 表示给定数据点属于该集群的概率

    2. -1 表示该数据点已被标记为噪声。如果你希望他们被分配Soft Clustering 可能是一个解决方案

    【讨论】:

      猜你喜欢
      • 2018-06-24
      • 2020-10-23
      • 1970-01-01
      • 2019-06-18
      • 2020-02-12
      • 2019-12-09
      • 2017-01-13
      • 2021-03-06
      • 1970-01-01
      相关资源
      最近更新 更多