【问题标题】:Can clusters overlap in hierarchical clustering?聚类可以在层次聚类中重叠吗?
【发布时间】:2017-02-19 09:32:44
【问题描述】:

Clustering result层次凝聚聚类中聚类可以重叠。我在 R 中实现了一个距离矩阵并绘制了集群,但结果显示集群相互重叠。

library(rioja)

View(dissimilarity)

dissimilarity=as.dist(dissimilarity)

#diss=dist(dissimilarity,method='canberra')
clust1=chclust(dissimilarity,method = "coniss")     #To plot the dendogram using coniss method
#clust=chclust(dissimilarity,method = "conslink")    #To plot the dendogram using conslink method
plot(clust1,hang=-1)

#creating the hclust object to implement hierarchial clustering

hc = hclust(dissimilarity, method = 'ward.D')
y_hc = cutree(hc,6)
dissimilarity=as.matrix(dissimilarity)    #To convert diss into a data matrix  
# Visualising the clusters
library(cluster)
clusplot(dissimilarity,
         y_hc,
         lines = 0,
         shade = FALSE,
         color = TRUE,
         labels= 1,
         plotchar = FALSE,
         span = TRUE,
         main = paste('Clusters'),
         )

【问题讨论】:

  • 你使用了哪个距离?层次聚类不应有重叠。
  • 请将该图加载到问题中,以便我们了解您所说的重叠是什么意思,并详细说明您如何使用哪些函数进行聚类。
  • 这是我使用过的代码,它告诉我,差异已经是一个差异矩阵。还给出了非欧几里得的距离。 @伯恩哈德
  • 我得到了一个相异矩阵,并提到它不是欧几里得。没有指定其他内容。 @CarlesMitjans
  • 图片已作为链接添加到问题@Bernhard

标签: r machine-learning statistics


【解决方案1】:

重叠集群的印象可能是基于可能的多维数据的二维图或函数语法的错误使用。 cluster 包中的函数clusplot 使用prcompcmdscale,具体取决于参数diss 为false 或true 用于降维。

根据help(clusplot)diss 告诉函数,是否将相异矩阵或观察矩阵赋予该函数。在你的情况下,在不设置diss = TRUE 的情况下为函数提供了一个相异矩阵。这可能是绘图功能的错误使用。

【讨论】:

    猜你喜欢
    • 2021-10-04
    • 2014-06-28
    • 2016-08-07
    • 2018-10-04
    • 2013-05-08
    • 2020-06-28
    • 2016-06-06
    • 1970-01-01
    • 2016-09-06
    相关资源
    最近更新 更多