【发布时间】:2013-12-07 02:16:09
【问题描述】:
以下代码在每次运行时给出不同的结果,同时使用 k 均值方法将数据聚类为 3 部分:
from numpy import array
from scipy.cluster.vq import kmeans,vq
data = array([1,1,1,1,1,1,3,3,3,3,3,3,7,7,7,7,7,7])
centroids = kmeans(data,3,100) #with 100 iterations
print (centroids)
获得的三个可能结果是:
(array([1, 3, 7]), 0.0)
(array([3, 7, 1]), 0.0)
(array([7, 3, 1]), 0.0)
其实计算出的k个均值的顺序是不一样的。但是,分配哪个 k 表示点属于哪个集群不是很不稳定吗?有什么想法吗??
【问题讨论】:
标签: python numpy scipy k-means