spss中的层次聚类输出以确定没有聚类？答案

【问题标题】：hierarchical clustering output in spss to determine no of clusters?spss中的层次聚类输出以确定没有聚类？
【发布时间】：2013-07-04 15:42:06
【问题描述】：

我在 SPSS 中对我的 100 条记录数据集应用了分层（凝聚）聚类。这条规则说，“距离系数越大，那个点决定了集群的数量。

公式：病例数 - 肘部步数 = 簇数我正在关注本教程'http://www.mvsolution.com/wp-content/uploads/SPSS-Tutorial-Cluster-Analysis.pdf'。问题是在我的输出中距离系数没有更大的跳跃那么我如何从中确定 k 的值？

当我计算距离系数的变化时，它出来了：

640-609= 31

900-846=54

962-900=62

1025-962=63

1091-1025=66

1160-1091=69

1233-1160=73

1305-1233=72

1379-1305=74

1460-1379=81

1543-1460=83

1630-1543=87

1728-1630=98

我需要 k 的值来应用 kmeans..

【问题讨论】：

【解决方案1】：

在仅由单个集群组成的数据集上（或者当距离函数不起作用时），（通常）不会有拐点。

您为什么不先在一些玩具数据集上尝试一下来熟悉层次聚类呢？在一个聚集的二维数据集、一个统一的二维数据集和一个具有单个高斯聚类的二维数据集上进行尝试，以了解这些图的行为方式。

然后尝试相同的数据集，但将它们反规范化，将一维缩放 10000。糟糕的规范化数据可能会完全隐藏您感兴趣的结构！

【讨论】：

我知道层次聚类的方法。我已经阅读了一些与之相关的教程。现在，当我将它应用于我的数据集时，我在输出中遇到了这个问题。除了我的数据集是非规范化的。我是集群的新手，建议我使用一些直接的技术来确定集群的数量。我正在使用 rapidminer 和 weka。