基于 SPSS 和 R 中的 3 个变量的聚类组答案

【问题标题】：Clustering groups based on 3 variables in SPSS and R基于 SPSS 和 R 中的 3 个变量的聚类组
【发布时间】：2020-03-30 15:54:59
【问题描述】：

我目前正在尝试了解聚类分析（使用 SPSS 和 R）。阅读了这么多关于它的内容让我更加困惑，不知道使用什么聚类方法来回答研究问题。

我的研究问题调查是否 a) 可以根据变量 A 的变化对某些参与者进行聚类（保持稳定的一组、恶化的一组以及改善超过 2 次评估的第三组)，和 b) 这些组/集群在评估 1（B 和 C）中在其他两个变量方面有何不同。也就是B和C模式不同的人，A的变化是不是不一样？

问题：我已经对数据进行了标准化，到目前为止，我已经尝试了两步分层和 k-means 聚类。但是，我不确定这是否是回答我的问题的正确方法。在集群数量固定的情况下，我选择了 3，因为我有兴趣看到随着时间的推移改善/恶化/保持稳定的人群，以及集群的 B 和 C 的个体模式。这是否可行？我错过了什么吗？

对于 k-means 聚类，我使用了以下语法：

QUICK CLUSTER z_A_change z_B_mean z_C_mean 
/MISSING=LISTWISE
/CRITERIA=CLUSTER(3) MXITER(10) CONVERGE(0) 
/METHOD=KMEANS(NOUPDATE) 
/SAVE CLUSTER DISTANCE

最后，有没有办法在 SPSS 中将这些集群可视化为 3-D 图？我对 R 的 ggplot2 或 scatterplot3d 并不像我想的那样精通。

提前谢谢你。

【问题讨论】：

这是一个关于 SPSS 的问题，而不是关于 R 的问题，因此您可能应该删除 R 标签。数据图片没有用。提供一个可重现的例子要好得多。在 R 中，这将涉及将 dput() 的输出粘贴到至少一小部分数据中。
我知道，我过去使用过 dput() 但现在我只有一个来自 SPSS 的示例。不知道如何以类似的方式导出 SPSS 输出。

标签： cluster-analysis k-means spss hierarchical-clustering

【解决方案1】：

如果您使用 TWOSTEP CLUSTER 或 QUICK CLUSTER 来拟合三集群解决方案并将集群成员保存为新变量，您可以通过聊天构建器创建分组的 3D 散点图。在菜单中，转到 Graphs>Chart Builder。在 Gallery 视图中，在 Choose from: 下选择 Scatter/Dot。在主画布下方显示的图标中，顶行右数第二个应该是分组的 3D 散点图。将该图标移动到画布中。为 X、Y 和 Z 轴选择聚类中使用的三个变量中的每一个。将集群成员变量指定为“设置颜色”变量，然后单击“确定”。

【讨论】：