【发布时间】:2018-12-13 03:21:40
【问题描述】:
我有以下脚本,可用于使用kmeans 查找群集的最佳编号。如何使用EM 集群技术而不是kmeans 更改以下脚本。
可重现的例子:
ourdata<- scale(USArrests)
欣赏!
wss <- (nrow(ourdata)-1)*sum(apply(ourdata,2,var))
for (i in 2:10) wss[i] <- sum(kmeans(ourdata,
centers=i)$withinss)
plot(1:10, wss, type="b", xlab="Number of Clusters", ylab="Within groups sum of squares")
【问题讨论】:
-
什么是 EM 聚类技术?你有那个方法的参考吗? EM 是最大化可能性的一般方法,您要建模的可能性是什么?此外,在寻求帮助时,您应该在reproducible example 中包含我们可用于测试的示例输入数据。
-
@MrFlick, EM:期望最大化。 “Arthur P Dempster、Nan M Laird 和 Donald B Rubin。通过 em 算法从不完整数据中获得最大似然性。皇家统计学会杂志。B 系列(方法学),1-38,1977。”
标签: r cluster-computing k-means