【发布时间】:2013-07-04 15:42:06
【问题描述】:
我在 SPSS 中对我的 100 条记录数据集应用了分层(凝聚)聚类。 这条规则说,“距离系数越大,那个点决定了集群的数量。
公式:病例数 - 肘部步数 = 簇数 我正在关注本教程'http://www.mvsolution.com/wp-content/uploads/SPSS-Tutorial-Cluster-Analysis.pdf'。问题是在我的输出中距离系数没有更大的跳跃那么我如何从中确定 k 的值?
当我计算距离系数的变化时,它出来了:
640-609= 31
671-640=31
711-671=40
755-711=44
800-755=45
846-800=46
900-846=54
962-900=62
1025-962=63
1091-1025=66
1160-1091=69
1233-1160=73
1305-1233=72
1379-1305=74
1460-1379=81
1543-1460=83
1630-1543=87
1728-1630=98
我需要 k 的值来应用 kmeans..
【问题讨论】:
-
考虑在stats.stackexchange.com也发布这个问题
标签: cluster-analysis spss hierarchical-clustering