【问题标题】:Compare the clustering algorithms in R比较 R 中的聚类算法
【发布时间】:2016-09-03 21:59:23
【问题描述】:

我在 R 中实现了 3 种聚类算法(PAM、k-means 和分层)。我想找出哪些参数会产生每种算法的最佳结果。

我不知道如何在 R 中做到这一点。

有人知道怎么做吗?

感谢您的帮助。

【问题讨论】:

  • 定义“最佳结果”,因为它适用于集群
  • 例如,我有 7 个集群,我需要将它与类变量进行比较。如何比较聚类是否有效地应用于算法。 R 是否提供任何工具或任何百分比来说明准确性?
  • 查看 NBclust!
  • 使用的集群数量是预先确定的(7)我正在寻找的是如何比较方法的有效性。

标签: r cluster-analysis k-means hierarchical-clustering


【解决方案1】:

您需要一个可以为所有 3 种聚类方法(如 BIC 标准)计算的统计量。

BIC 最低的模型最好。然而,这个标准应该谨慎使用,因为过度拟合是一个常见的问题。

【讨论】:

    猜你喜欢
    • 2013-07-03
    • 1970-01-01
    • 2019-12-06
    • 2020-12-11
    • 2020-07-20
    • 1970-01-01
    • 1970-01-01
    • 2016-05-07
    • 1970-01-01
    相关资源
    最近更新 更多