【发布时间】:2017-06-09 01:01:32
【问题描述】:
我必须在数据集上使用 k 均值聚类(我正在使用 Scikit 学习),看起来像这样
但是当我应用 K 意味着它没有给我预期的质心。并且分类错误。 如果我想知道在 scikit learn 中没有正确分类的点,还有什么想法。 这是代码。
km = KMeans(n_clusters=3, init='k-means++', max_iter=300, n_init=10)
km.fit(Train_data.values)
plt.plot(km.cluster_centers_[:,0],km.cluster_centers_[:,1],'ro')
plt.show()
这里的 Train_data 是 pandas 框架,具有 2 个特征和 3500 个样本,代码如下。
我可能是因为初始质心选择不当而发生的,但解决办法是什么?
【问题讨论】:
-
请提供您的代码。
-
@Farseer 我已经添加了。
标签: python scikit-learn k-means