R中的聚类答案

【问题标题】：Clustering in RR中的聚类
【发布时间】：2016-12-09 17:56:12
【问题描述】：

我使用 hclust 对我的数据进行聚类，并使用 cutree 将聚类数指定为 3。有什么方法可以检查每个聚类吗？通过检查，我的意思是列出例如中的案例/观察结果。第一个集群。我尝试了所有我知道的基本功能，例如 summary()、list()...但似乎不相关。任何函数都可以做到这一点？

如果不是，cutree 函数会返回我的每个观察所属的组/集群的列表，如下所示：

1,3,1,2,3,3,1

这表明我的第一次观察属于第 1 组，第二次属于第 3 组... 我正在考虑如何从该列表中提取位置，例如group = 1，因此它将返回 1,3 和 7，因为观测值 1,3,7 属于组 1

或者我需要使用循环来计算属于例如的所有观察值。该列表中的第 1 组？

我的问题清楚了吗？

【问题讨论】：

No 你的问题不是很清楚，但在尝试回答。您有来自 cutree 函数的列表：1,3,1,2,3,3,1，您可以使用此数组对原始数据框进行子集化或分组，以检查各个集群。仅供参考：提供一个示例（数据和输出对于在本论坛获得帮助大有帮助。
我成功了，谢谢大家！

标签： r cluster-analysis hierarchical-clustering

【解决方案1】：

这是一个提示，而不是答案。这是Hierarchical Clustering in R 的示例。您可以尝试使用函数table()、ggplot() 来查看每个集群的观察结果。

【讨论】：

【解决方案2】：

这对开始有帮助吗？

nclust <- 10 

cutreeout <- cutree(hclustOutput, nclust)

将它们作为新列添加到您的数据框

mydata$cluster <- cutreeout

每个集群中有多少个观测值？

table(mydata$cluster)

然后你可以做更多的事情来解释你的集群，和/或研究你的数据子集。

【讨论】：