【发布时间】:2012-10-21 06:11:04
【问题描述】:
我正在寻找一个 python 库来将一组坐标组织成簇。我的输入是一个(纬度、经度)坐标列表,我想获得一个根据距离对它们进行分组的集群列表。
我事先不知道我需要获得多少个集群,所以我不能使用 K-Means(比如cluster module)算法(至少不是一个人,也许我有一个算法我可用于根据输入数据获取该数字)。
我也查看了clusterpy,但它似乎对任务来说过于复杂,文档也不是很有指导意义。
【问题讨论】:
-
也许使用分层集群的集群模块是要走的路。我最初放弃了它,因为我认为我只能使用专有方法,但是对于我拥有的数据集,这可能有点问题。
-
“我事先不知道我需要获得多少个集群,所以我不能使用 K-Means 之类的东西”您几乎可以肯定使用 k-means,并使用任何计算 k 的许多算法。见en.wikipedia.org/wiki/… 和stackoverflow.com/questions/1793532/…。
-
我最终使用了分层算法。由于坐标属于不同社区的地址,并且我想为每个社区获取一个集群,因此算法的合理距离限制足以获得我预期的输出。