【发布时间】:2015-11-17 19:40:16
【问题描述】:
我正在学习 R 并且在进行 K 均值聚类时,我多次遇到以下函数来确定碎石图中的最佳 K。 现在,我确实理解了函数背后的逻辑,但是我很难理解 R 函数,有人可以解释一下吗。
wssplot <- function(data, nc=15, seed=1234)
{
wss <- (nrow(data)-1)*sum(apply(data,2,var))
for (i in 2:nc)
{
set.seed(seed)
wss[i] <- sum(kmeans(data, centers=i)$withinss)
}
plot(1:nc, wss, type="b", xlab="Number of Clusters",
ylab="Within groups sum of squares")
}
【问题讨论】:
-
你有什么不明白的?
-
避免编辑标题:scree plot
-
不明白
wss <- (nrow(data)-1)*sum(apply(data,2,var))的需要和作用。 -
@Pascal - 我该怎么称呼它,我想不出一个不同的标题。请推荐!
-
你在说什么?保持您的标题不变。
标签: r cluster-analysis k-means