R - 在聚类分析中识别“主要示例”答案

【问题标题】：R - Identify "Prime Examples" in Cluster AnalysisR - 在聚类分析中识别“主要示例”
【发布时间】：2018-07-06 18:48:37
【问题描述】：

我进行了聚类分析，结果我得到了 4 个不同的聚类。使用 $kcmem 我可以看到哪个站属于哪个集群。但我想从每个集群中挑选一个 Station 并进一步分析。

我得到了这个结果（它只是一个测试，我有超过 6 个站）。我挑选了 4 个集群。

$kcmem
     4 5
[1,] 1 1
[2,] 2 2
[3,] 3 3
[4,] 3 3
[5,] 4 4
[6,] 4 5

当然，我想为每个集群选择最典型的 Station。我怎么做？从主成分分析中我知道实际上有一个加载列表，您可以看到一个站与一个组的相关程度。

我只能认为$kccentroids？但是同一个集群中的所有站点都具有相同的值。

$kccentroids
     [,1]      [,2]      [,3]      [,4]      [,5]      [,6]
4 1.0000000 0.5043308 0.7270394 0.7269328 0.6742015 0.6782120
4 0.5043308 1.0000000 0.5465914 0.5685687 0.6443715 0.5181649
4 0.7269861 0.5575801 0.9541015 0.9541015 0.8253911 0.8108125
4 0.6762068 0.5812682 0.7937889 0.8424147 0.9630949 0.9630949

有人可以帮忙吗？我需要一个命令来显示一个站为什么属于某个集群，这样我就可以选择每个集群的 1 个站作为“主要示例”。

【问题讨论】：

这不是一个真正的编程问题。通过在Cross Validated 或Data Science 上发布此内容，您可能会得到更好的回复
好的，谢谢！我不知道这不算编程。
在我看来，这不是关于编码，而是关于什么算法是合适的。
好吧，我想我需要一个特殊的代码来获取加载项。我没有在我的“正常”集群输出中看到它们。这就是为什么我认为我需要一个命令来获取它们。

标签： r cluster-analysis hierarchical-clustering

【解决方案1】：

选择离集群质心最近的站点。

这将是 KMeans 的常用方法。

如果您使用诸如 PAM (k medoids) 或亲和传播或 minimax 等算法，那么这些方法自然会提供集群代表。

【讨论】：