【问题标题】:Is this formula just the same like purity formula validation?这个公式和纯度公式验证一样吗?
【发布时间】:2018-07-13 14:35:49
【问题描述】:

我读过的大多数论文都使用外部验证来验证这个公式的聚类准确性: 其中 ai 是出现在第 i 个集群中的数据对象的数量 及其对应的真类,n为数据集中数据对象的个数。根据这一措施,较高的 r 值表示 更好的聚类结果,完美的聚类产生一个值 r = 1.0

这个公式和纯度公式一样吗? 你可以在这里阅读纯度https://stats.stackexchange.com/questions/95731/how-to-calculate-purity

还是谢谢

【问题讨论】:

    标签: validation cluster-analysis


    【解决方案1】:

    我不同意论文中关于这将是“普遍”使用的说法。常用的度量是 ARI(调整兰德指数)和 NMI(归一化互信息)。

    但是,吨,这看起来与纯度相同。有同样的缺陷。

    据推测,他们使用的衡量标准是偏向于将“真正的”集群分解成更小的块。如果 k=n,每个点都是它自己的簇,那么 all so 将是 1,这个度量将评估结果为完美。

    所以你不能用它来比较不同k的结果。

    【讨论】:

      猜你喜欢
      • 2015-02-06
      • 2021-07-23
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2023-01-08
      • 2022-11-03
      相关资源
      最近更新 更多