【发布时间】:2013-10-22 00:39:21
【问题描述】:
我正在使用 weka 进行 K-means 聚类,当我尝试了一个小集合并发现 群内误差平方和 (WCSS) 值不是我想的那样。
我认为 WCSS 是所有元素到它的集群中心的平方距离之和, 但值不对:
例如: 数据集是:
3.0, 2.0, 3.0, 0.0, 0.0, 2.0, 1.0, 0.0, 1.0
4.0, 1.0, 3.0, 0.0, 1.0, 0.0, 1.0, 4.0, 1.0
4.0, 1.0, 7.0, 0.0, 1.0, 1.0, 0.0, 1.0, 1.0
3.0, 2.0, 7.0, 0.0, 0.0, 2.0, 1.0, 1.0, 0.0
3.0, 2.0, 6.0, 1.0, 0.0, 1.0, 0.0, 2.0, 1.0
4.0, 2.0, 5.0, 1.0, 1.0, 1.0, 1.0, 0.0, 0.0
4.0, 1.0, 8.0, 0.0, 1.0, 2.0, 0.0, 0.0, 1.0
3.0, 2.0, 2.0, 0.0, 1.0, 1.0, 0.0, 0.0, 1.0
3.0, 2.0, 0.0, 0.0, 1.0, 1.0, 1.0, 3.0, 1.0
集群(只有一个)中心是3, 2, 3, 0, 1, 1, 1, 0, 1:
weka 输出的 WCSS 是 39,但根据我的理解,应该是133。
我知道我对 WCSS 的含义一定是错的,有人可以告诉我吗?
【问题讨论】:
标签: cluster-analysis weka k-means