【发布时间】:2013-06-29 21:49:12
【问题描述】:
最近看了Single Pass Seed Selection Algorithm for k-Means的文章,但是对算法不是很了解,就是:
- 计算距离矩阵
Dist,其中Dist (i,j)表示从i到j的距离 - 找到
Sumv,其中Sumv (i)是从ith 点到所有其他点的距离之和。 - 找到
i即min (Sumv)并设置Index = i - 将 First 添加到
C作为第一个质心 - 对于每个点
xi,将D (xi)设置为xi与C中最近点之间的距离 - 找到
y作为第一个n/k与Index最近的点的距离之和 - 找到唯一的整数
i,这样D(x1)^2+D(x2)^2+...+D(xi)^2 >= y > D(x1)^2+D(x2)^2+...+D(x(i-1))^2 - 将
xi添加到C - 重复步骤 5-8,直到
k中心
尤其是第 6 步,我们是否仍然一遍又一遍地使用相同的Index(同一点)还是使用来自C 的新添加点?关于第 8 步,i 是否必须大于1?
【问题讨论】:
标签: algorithm machine-learning