【问题标题】:Clustering of Mixed Data using Euclidean distance使用欧几里得距离对混合数据进行聚类
【发布时间】:2019-11-23 09:24:07
【问题描述】:

我有一个数据集,其中包含连续和分类类型的数据。

任何人都可以帮助解决以下问题。

我可以使用 k-means 聚类和欧几里得距离还是应该使用 Gower 距离?

何时使用欧几里得距离/高尔距离?

我们怎么知道我们已经形成了正确的集群?

【问题讨论】:

    标签: machine-learning cluster-analysis k-means


    【解决方案1】:

    K-means 和欧几里得距离是在实数向量空间上定义的。因此,它们不是在混合数据上定义的。因此你不能使用它们,它不是 k-means / Euclidean distance,而是不同的东西。

    如果您对文学进行一些研究,有很多选择。

    永远知道你是否拥有“正确”的集群,因为没有“正确”或“错误”的集群。这是主观的,不是客观的。

    【讨论】:

      猜你喜欢
      • 2016-05-24
      • 2013-03-02
      • 2015-07-15
      • 2014-02-04
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多