【发布时间】:2021-12-13 23:15:33
【问题描述】:
我正在尝试探索creditcard fraud dataset 来学习 R 和 k-means 聚类。但是我在获得最佳集群数量时遇到了一个问题。不幸的是,关于该错误甚至如何在 R 中执行 kmeans 聚类的发现都不是谷歌。我想知道警告是什么?为什么结果只显示 1 个集群?提前致谢!
代码:
data = read.csv("creditcard.csv")
scaled_data <- scale(data )
wss <- (nrow(scaled_data)-1)*sum(apply(scaled_data,2,var))
for (i in 2:100) wss[i] <- sum(kmeans(scaled_data, centers=i)$withiness)
plot(1:100, wss, type='b', xlab="Clusters", ylab="WSS")
警告:
Warning messages:
1: Quick-TRANSfer stage steps exceeded maximum (= 14240350)
2: did not converge in 10 iterations
3: Quick-TRANSfer stage steps exceeded maximum (= 14240350)
4: did not converge in 10 iterations
【问题讨论】:
-
这不是错误,而是警告。正如它所说,在 10 次迭代后没有达到收敛。要么允许更多迭代,要么降低收敛阈值。
标签: r cluster-analysis k-means data-mining credit-card