【问题标题】:Scikit-learn: ARI score for cluster evaluationScikit-learn:用于集群评估的 ARI 分数
【发布时间】:2020-06-27 23:52:17
【问题描述】:

我正在计算 evaluating the cluster performance 的调整后兰德指数分数。假设,真实的集群和预测的集群如下所示。 {i, "x"} 格式表明元素 "x" 位于 ith 簇中。

>>> labels_true = [{0,"a"}, {0,"b"}, {0,"c"}, {1,"d"}, {1,"e"}, {1,"f"}]
>>> labels_pred = [{0,"a"}, {0,"b"}, {1,"c"}, {1,"d"}, {2,"e"}, {2,"f"}]
>>> metrics.adjusted_rand_score(labels_true, labels_pred)

ARI 分数即将达到 1.0,但它似乎不应该是 1.0,因为预测的集群与真实的集群不同。

我想知道这是否是计算 ARI 分数的有效方法。

【问题讨论】:

    标签: python scikit-learn cluster-analysis


    【解决方案1】:

    您只需将标签放在 ARI 分数函数中:
    labels_true = [0, 0, 0, 1, 1, 1]
    labels_pred = [0, 0, 1, 1, 2, 2]
    metrics.adjusted_rand_score(labels_true, labels_pred)

    【讨论】:

      猜你喜欢
      • 2018-08-29
      • 2013-06-04
      • 2016-06-27
      • 2017-06-23
      • 2019-04-27
      • 2014-09-02
      • 2014-10-03
      • 2016-08-07
      • 2018-05-14
      相关资源
      最近更新 更多