【问题标题】:Can someone explain how to use Ward's method to initialize k-means?有人可以解释如何使用 Ward 的方法来初始化 k-means 吗?
【发布时间】:2018-03-24 14:19:32
【问题描述】:

我了解使用 Ward 方法作为邻近度度量的 HAC(分层凝聚聚类)。但是一旦我这样做了,我该如何使用它来初始化 k-means?我是否只是在我已经计划用于 k-means 的预定 k 处抓取 k 个集群?或者层次聚类也帮助我选择k?

【问题讨论】:

标签: algorithm cluster-analysis data-mining k-means hierarchical-clustering


【解决方案1】:

正如http://www.stat.cmu.edu/~cshalizi/350/lectures/08/lecture-08.pdf 中所述,这很有意义:该技术包括用 Ward 确定 k,然后应用 k 均值“从 Ward 方法找到的聚类开始,从一个好的起点减少平方和”。

【讨论】:

    【解决方案2】:

    显然,您也可以使用它来帮助您选择 k。

    但是当您已经使用 HAC 时,我并没有真正看到使用 k-means 的意义。做k-means的主要原因是因为它通常很快,而HAC总是很慢。所以这对我来说似乎有点过头了。

    【讨论】:

    • 我也是这么想的。 K-means 是O(N*K*I),其中 K 是簇数,I 是决定“足够”之前的迭代次数。而 HAC 是立方 afaik(有更有效的 hac 版本吗?)
    猜你喜欢
    • 1970-01-01
    • 2019-12-29
    • 2016-11-06
    • 2012-07-09
    • 2011-12-26
    • 2011-01-16
    • 2021-08-03
    • 2019-06-05
    • 2019-11-25
    相关资源
    最近更新 更多