【发布时间】:2018-03-03 17:23:27
【问题描述】:
我是 Python 的初学者。现在,我试图了解sklearn.cluster.KMeans
中的参数 n_init 是什么来自文档:
n_init :整数,默认值:10
使用不同质心种子运行 k-means 算法的次数。最终结果将是 n_init 连续运行在惯性方面的最佳输出。
起初,我认为这意味着代码运行的次数,直到我找到这个helpful question,我意识到这就是 max_iter 所做的。
参数 n_init 究竟是做什么的?实在看不懂。
【问题讨论】:
-
由于起点是随机的,
n_init说明算法应该使用多少组不同的随机点。然后它在惯性方面给出了最好的运行(算法在运行结束时移动了多少 - 小步骤 --> 更接近最佳解决方案) -
它将随机初始化集群的质心这么多次。根据质心的初始值,形成的簇可能不同。
标签: python machine-learning scikit-learn cluster-analysis k-means