【问题标题】:Reconnect Segmented Data into Original Database将分段数据重新连接到原始数据库
【发布时间】:2019-12-13 05:21:14
【问题描述】:

我正在尝试仅使用来自我的数据源的数据子集在 R 中运行 k-means 聚类分析。我创建了子集(作为数据框),因为我只对使用这些变量进行分段感兴趣,其余变量将用于描述分段。

k-means 聚类完成后,我想知道如何将聚类结果连接回我的原始数据集,其中还包括描述性变量。

如果我能就我的问题提供任何澄清,请告诉我。提前谢谢了。

干杯, 交流

【问题讨论】:

  • 如果您可以使用代码和一些示例数据展示您正在谈论的内容,那将会有所帮助。看看 R 中的 iris 数据集是否适合您的需求。
  • 阅读 kmeans 的手册页(如果您使用的是 base R 附带的版本,而不是其他包中的版本)。 kmeans() 函数返回一个列表,列表的第一个元素(命名为簇)是您要添加到数据中的元素。它指示每行属于哪个集群。列表的其他部分都不相关,因为它们不引用原始数据的每一行。

标签: r cluster-analysis


【解决方案1】:

您会为每个点获得一个集群标签。

这些应该引用与原始数据相同的样本。

【讨论】:

    猜你喜欢
    • 2017-09-05
    • 2023-04-02
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2011-03-26
    • 1970-01-01
    • 2011-06-29
    • 1970-01-01
    相关资源
    最近更新 更多