【发布时间】:2019-11-23 09:24:07
【问题描述】:
我有一个数据集,其中包含连续和分类类型的数据。
任何人都可以帮助解决以下问题。
我可以使用 k-means 聚类和欧几里得距离还是应该使用 Gower 距离?
何时使用欧几里得距离/高尔距离?
我们怎么知道我们已经形成了正确的集群?
【问题讨论】:
标签: machine-learning cluster-analysis k-means
我有一个数据集,其中包含连续和分类类型的数据。
任何人都可以帮助解决以下问题。
我可以使用 k-means 聚类和欧几里得距离还是应该使用 Gower 距离?
何时使用欧几里得距离/高尔距离?
我们怎么知道我们已经形成了正确的集群?
【问题讨论】:
标签: machine-learning cluster-analysis k-means
K-means 和欧几里得距离是在实数向量空间上定义的。因此,它们不是在混合数据上定义的。因此你不能使用它们,它不是 k-means / Euclidean distance,而是不同的东西。
如果您对文学进行一些研究,有很多选择。
你永远知道你是否拥有“正确”的集群,因为没有“正确”或“错误”的集群。这是主观的,不是客观的。
【讨论】: