【发布时间】:2017-02-19 09:32:44
【问题描述】:
Clustering result层次凝聚聚类中聚类可以重叠。我在 R 中实现了一个距离矩阵并绘制了集群,但结果显示集群相互重叠。
library(rioja)
View(dissimilarity)
dissimilarity=as.dist(dissimilarity)
#diss=dist(dissimilarity,method='canberra')
clust1=chclust(dissimilarity,method = "coniss") #To plot the dendogram using coniss method
#clust=chclust(dissimilarity,method = "conslink") #To plot the dendogram using conslink method
plot(clust1,hang=-1)
#creating the hclust object to implement hierarchial clustering
hc = hclust(dissimilarity, method = 'ward.D')
y_hc = cutree(hc,6)
dissimilarity=as.matrix(dissimilarity) #To convert diss into a data matrix
# Visualising the clusters
library(cluster)
clusplot(dissimilarity,
y_hc,
lines = 0,
shade = FALSE,
color = TRUE,
labels= 1,
plotchar = FALSE,
span = TRUE,
main = paste('Clusters'),
)
【问题讨论】:
-
你使用了哪个距离?层次聚类不应有重叠。
-
请将该图加载到问题中,以便我们了解您所说的重叠是什么意思,并详细说明您如何使用哪些函数进行聚类。
-
这是我使用过的代码,它告诉我,差异已经是一个差异矩阵。还给出了非欧几里得的距离。 @伯恩哈德
-
我得到了一个相异矩阵,并提到它不是欧几里得。没有指定其他内容。 @CarlesMitjans
-
图片已作为链接添加到问题@Bernhard
标签: r machine-learning statistics