【问题标题】:R - Identify "Prime Examples" in Cluster AnalysisR - 在聚类分析中识别“主要示例”
【发布时间】:2018-07-06 18:48:37
【问题描述】:

我进行了聚类分析,结果我得到了 4 个不同的聚类。使用 $kcmem 我可以看到哪个站属于哪个集群。但我想从每个集群中挑选一个 Station 并进一步分析。

我得到了这个结果(它只是一个测试,我有超过 6 个站)。我挑选了 4 个集群。

$kcmem
     4 5
[1,] 1 1
[2,] 2 2
[3,] 3 3
[4,] 3 3
[5,] 4 4
[6,] 4 5

当然,我想为每个集群选择最典型的 Station。我怎么做?从主成分分析中我知道实际上有一个加载列表,您可以看到一个站与一个组的相关程度。

我只能认为$kccentroids?但是同一个集群中的所有站点都具有相同的值。

$kccentroids
     [,1]      [,2]      [,3]      [,4]      [,5]      [,6]
4 1.0000000 0.5043308 0.7270394 0.7269328 0.6742015 0.6782120
4 0.5043308 1.0000000 0.5465914 0.5685687 0.6443715 0.5181649
4 0.7269861 0.5575801 0.9541015 0.9541015 0.8253911 0.8108125
4 0.6762068 0.5812682 0.7937889 0.8424147 0.9630949 0.9630949

有人可以帮忙吗?我需要一个命令来显示一个站为什么属于某个集群,这样我就可以选择每个集群的 1 个站作为“主要示例”。

【问题讨论】:

  • 这不是一个真正的编程问题。通过在Cross ValidatedData Science 上发布此内容,您可能会得到更好的回复
  • 好的,谢谢!我不知道这不算编程。
  • 在我看来,这不是关于编码,而是关于什么算法是合适的。
  • 好吧,我想我需要一个特殊的代码来获取加载项。我没有在我的“正常”集群输出中看到它们。这就是为什么我认为我需要一个命令来获取它们。

标签: r cluster-analysis hierarchical-clustering


【解决方案1】:

选择离集群质心最近的站点。

这将是 KMeans 的常用方法。

如果您使用诸如 PAM (k medoids) 或亲和传播或 minimax 等算法,那么这些方法自然会提供集群代表。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2015-04-18
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2016-06-29
    • 2015-01-03
    • 2017-09-23
    • 2013-02-28
    相关资源
    最近更新 更多