【发布时间】:2017-04-15 05:01:03
【问题描述】:
所以我可以像下面这样运行sklearn kmeans:
kmeans = KMeans(n_clusters=3,init='random',n_init=10,max_iter=500)
但我对参数的含义有点困惑
所以n_init 说:
使用不同质心种子运行 k-means 算法的次数。最终结果将是 n_init 连续运行在惯性方面的最佳输出。
和max_iter 说:
k-means 算法单次运行的最大迭代次数。
但我不完全明白这意味着什么。在给定一组初始质心的情况下,n_init 是质心靠近点均值的次数吗?
max_iter 是整个算法以新的初始质心运行的次数吗?
例如,对于max_iter=2,n_init=15,kmeans 将选择初始质心,然后将这些质心移动 15 次并得出聚类结果。然后 kmeans 将再次选择初始质心,移动这些质心 15 次,然后停止。那么,它会从两次运行中挑选出最好的集群吗?
感谢您的帮助!
[编辑] 还是与我在这里的完全相反...?
【问题讨论】:
标签: python scikit-learn k-means