【问题标题】:Clustering in RR中的聚类
【发布时间】:2016-12-09 17:56:12
【问题描述】:

我使用 hclust 对我的数据进行聚类,并使用 cutree 将聚类数指定为 3。有什么方法可以检查每个聚类吗?通过检查,我的意思是列出例如中的案例/观察结果。第一个集群。我尝试了所有我知道的基本功能,例如 summary()、list()...但似乎不相关。任何函数都可以做到这一点?

如果不是,cutree 函数会返回我的每个观察所属的组/集群的列表,如下所示:

1,3,1,2,3,3,1

这表明我的第一次观察属于第 1 组,第二次属于第 3 组... 我正在考虑如何从该列表中提取位置,例如group = 1,因此它将返回 1,3 和 7,因为观测值 1,3,7 属于组 1

或者我需要使用循环来计算属于例如的所有观察值。该列表中的第 1 组?

我的问题清楚了吗?

【问题讨论】:

  • No 你的问题不是很清楚,但在尝试回答。您有来自 cutree 函数的列表:1,3,1,2,3,3,1,您可以使用此数组对原始数据框进行子集化或分组,以检查各个集群。仅供参考:提供一个示例(数据和输出对于在本论坛获得帮助大有帮助。
  • 我成功了,谢谢大家!

标签: r cluster-analysis hierarchical-clustering


【解决方案1】:

这是一个提示,而不是答案。这是Hierarchical Clustering in R 的示例。您可以尝试使用函数table()ggplot() 来查看每个集群的观察结果。

【讨论】:

    【解决方案2】:

    这对开始有帮助吗?

    nclust <- 10 
    
    cutreeout <- cutree(hclustOutput, nclust)
    

    将它们作为新列添加到您的数据框

    mydata$cluster <- cutreeout
    

    每个集群中有多少个观测值?

    table(mydata$cluster)
    

    然后你可以做更多的事情来解释你的集群,和/或研究你的数据子集。

    【讨论】:

      猜你喜欢
      • 2012-04-02
      • 1970-01-01
      • 2010-11-30
      • 1970-01-01
      • 1970-01-01
      • 2015-05-23
      • 2013-02-28
      相关资源
      最近更新 更多