【发布时间】:2013-11-26 05:53:50
【问题描述】:
我一直在 scipy 和 sklearn 中寻找针对我遇到的特定问题的聚类算法。我需要某种方法将 N 个粒子群表征为 k 个组,其中 k 不一定知道,除此之外,没有已知的先验链接长度(类似于 question)。
我已经尝试过 kmeans,如果您知道需要多少个集群,它会很有效。我试过 dbscan,除非您告诉它是停止寻找(或开始寻找)集群的特征长度尺度,否则效果不佳。问题是,我可能有数千个这样的粒子簇,我不能花时间告诉 kmeans/dbscan 算法它们应该如何处理。
以下是 dbscan 查找内容的示例:
您可以看到这里确实有两个独立的粒子群,虽然调整了 epsilon 因子(相邻簇之间的最大距离参数),但我根本无法看到这两个粒子群。
还有其他算法可以在这里工作吗?我正在寻找最少的信息 - 换句话说,我希望算法能够就什么可以构成一个单独的集群做出“智能”决策。
【问题讨论】:
标签: cluster-analysis k-means dbscan