【发布时间】:2019-12-13 05:21:14
【问题描述】:
我正在尝试仅使用来自我的数据源的数据子集在 R 中运行 k-means 聚类分析。我创建了子集(作为数据框),因为我只对使用这些变量进行分段感兴趣,其余变量将用于描述分段。
k-means 聚类完成后,我想知道如何将聚类结果连接回我的原始数据集,其中还包括描述性变量。
如果我能就我的问题提供任何澄清,请告诉我。提前谢谢了。
干杯, 交流
【问题讨论】:
-
如果您可以使用代码和一些示例数据展示您正在谈论的内容,那将会有所帮助。看看 R 中的
iris数据集是否适合您的需求。 -
阅读 kmeans 的手册页(如果您使用的是 base R 附带的版本,而不是其他包中的版本)。 kmeans() 函数返回一个列表,列表的第一个元素(命名为簇)是您要添加到数据中的元素。它指示每行属于哪个集群。列表的其他部分都不相关,因为它们不引用原始数据的每一行。
标签: r cluster-analysis