【发布时间】:2012-10-16 00:15:51
【问题描述】:
在 SOM 中收集和组织数据后,如何识别集群?
(项目使用许多特征进行聚合和聚类 - 超过 10 个)
具体来说,我想找到集群的“中心”——因此给了我“中心”节点。
【问题讨论】:
标签: cluster-analysis som
在 SOM 中收集和组织数据后,如何识别集群?
(项目使用许多特征进行聚合和聚类 - 超过 10 个)
具体来说,我想找到集群的“中心”——因此给了我“中心”节点。
【问题讨论】:
标签: cluster-analysis som
您可以使用相对较小的地图并将每个节点视为一个集群,但这远非最佳。如果您想应用自动集群检测方法,您绝对应该阅读
Clustering of the Self−Organizing Map
并搜索类似的参考书目。
您还可以使用更复杂的 SOM 算法版本(多级、自增长等)。
无论如何,请记住,找到“正确”簇数的问题没有有限的解决方案。
【讨论】:
据我所知,SOM 主要是一种数据驱动的降维和数据压缩方法。所以它不会为您聚类数据;它实际上可能倾向于在投影中散布簇(即将它们分成多个单元格)。
但是,对于 一些 数据集,它可能适用于:
然后对转换后的数据运行常规聚类算法。
【讨论】:
虽然一个老问题我遇到了同样的问题,并且我在实现Estimating the Number of Clusters in Multivariate Data by Self-Organizing Maps 方面取得了一些成功,所以我想我会分享。
链接算法使用 U 矩阵突出显示各个集群的边界,然后使用称为分水岭的图像处理算法来识别组件。为使其正常工作,u 矩阵中的区域需要在量化的分辨率范围内凹入(当转换为二进制图像时,只会导致使用填充来识别区域)。
【讨论】: