【发布时间】:2020-03-30 15:54:59
【问题描述】:
我目前正在尝试了解聚类分析(使用 SPSS 和 R)。阅读了这么多关于它的内容让我更加困惑,不知道使用什么聚类方法来回答研究问题。
我的研究问题调查是否 a) 可以根据变量 A 的变化对某些参与者进行聚类(保持稳定的一组、恶化的一组以及改善超过 2 次评估的第三组),和 b) 这些组/集群在评估 1(B 和 C)中在其他两个变量方面有何不同。也就是B和C模式不同的人,A的变化是不是不一样?
问题:我已经对数据进行了标准化,到目前为止,我已经尝试了两步分层和 k-means 聚类。但是,我不确定这是否是回答我的问题的正确方法。在集群数量固定的情况下,我选择了 3,因为我有兴趣看到随着时间的推移改善/恶化/保持稳定的人群,以及集群的 B 和 C 的个体模式。这是否可行?我错过了什么吗?
对于 k-means 聚类,我使用了以下语法:
QUICK CLUSTER z_A_change z_B_mean z_C_mean
/MISSING=LISTWISE
/CRITERIA=CLUSTER(3) MXITER(10) CONVERGE(0)
/METHOD=KMEANS(NOUPDATE)
/SAVE CLUSTER DISTANCE
最后,有没有办法在 SPSS 中将这些集群可视化为 3-D 图?我对 R 的 ggplot2 或 scatterplot3d 并不像我想的那样精通。
提前谢谢你。
【问题讨论】:
-
这是一个关于 SPSS 的问题,而不是关于 R 的问题,因此您可能应该删除 R 标签。数据图片没有用。提供一个可重现的例子要好得多。在 R 中,这将涉及将
dput()的输出粘贴到至少一小部分数据中。 -
我知道,我过去使用过 dput() 但现在我只有一个来自 SPSS 的示例。不知道如何以类似的方式导出 SPSS 输出。
标签: cluster-analysis k-means spss hierarchical-clustering