【问题标题】:Identify clusters in SOM (Self Organizing Map)识别 SOM(自组织图)中的集群
【发布时间】:2012-10-16 00:15:51
【问题描述】:

在 SOM 中收集和组织数据后,如何识别集群?

(项目使用许多特征进行聚合和聚类 - 超过 10 个)

具体来说,我想找到集群的“中心”——因此给了我“中心”节点。

【问题讨论】:

    标签: cluster-analysis som


    【解决方案1】:

    您可以使用相对较小的地图并将每个节点视为一个集群,但这远非最佳。如果您想应用自动集群检测方法,您绝对应该阅读

    Clustering of the Self−Organizing Map

    并搜索类似的参考书目。

    您还可以使用更复杂的 SOM 算法版本(多级、自增长等)。

    无论如何,请记住,找到“正确”簇数的问题没有有限的解决方案。

    【讨论】:

    • 有些聚类算法不需要知道聚类的数量。您只需要使用比 k-means 和层次聚类更现代的东西。
    • 您基本上可以做的是两个步骤:构建和训练 som。然后,在静态数量的集群或动态数量的集群上对 SOM 进行集群。
    • @khan,你所说的“集群 SOM”是什么意思?我认为通过训练 SOM,您可以对数据进行聚类/缩减维度。谢谢
    【解决方案2】:

    据我所知,SOM 主要是一种数据驱动的降维数据压缩方法。所以它不会为您聚类数据;它实际上可能倾向于在投影中散布簇(即将它们分成多个单元格)。

    但是,对于 一些 数据集,它可能适用于:

    • 仅在 SOM 节点(按分配给它们的元素数量加权)上工作,而不是处理完整的数据集,该节点应该小得多
    • 不要在原始空间中工作,而是在 SOM 所代表的低维空间中工作

    然后对转换后的数据运行常规聚类算法。

    【讨论】:

      【解决方案3】:

      虽然一个老问题我遇到了同样的问题,并且我在实现Estimating the Number of Clusters in Multivariate Data by Self-Organizing Maps 方面取得了一些成功,所以我想我会分享。

      链接算法使用 U 矩阵突出显示各个集群的边界,然后使用称为分水岭的图像处理算法来识别组件。为使其正常工作,u 矩阵中的区域需要在量化的分辨率范围内凹入(当转换为二进制图像时,只会导致使用填充来识别区域)。

      【讨论】:

        猜你喜欢
        • 2020-03-25
        • 2010-12-10
        • 2013-10-08
        • 1970-01-01
        • 2013-03-23
        • 2016-11-08
        • 2012-02-03
        • 1970-01-01
        • 1970-01-01
        相关资源
        最近更新 更多