【发布时间】:2016-09-03 21:59:23
【问题描述】:
我在 R 中实现了 3 种聚类算法(PAM、k-means 和分层)。我想找出哪些参数会产生每种算法的最佳结果。
我不知道如何在 R 中做到这一点。
有人知道怎么做吗?
感谢您的帮助。
【问题讨论】:
-
定义“最佳结果”,因为它适用于集群
-
例如,我有 7 个集群,我需要将它与类变量进行比较。如何比较聚类是否有效地应用于算法。 R 是否提供任何工具或任何百分比来说明准确性?
-
查看 NBclust!
-
使用的集群数量是预先确定的(7)我正在寻找的是如何比较方法的有效性。
标签: r cluster-analysis k-means hierarchical-clustering