【发布时间】:2016-01-01 12:18:47
【问题描述】:
我有对象和距离函数,并希望使用scikit-learn 中的DBSCAN 方法对它们进行聚类。我的对象在欧几里得空间中没有表示。我知道,可以使用precomputed 度量,但在我的情况下,由于距离矩阵很大,这是非常不切实际的。 scikit-learn 有没有办法克服这个问题?也许,还有其他 DBSCAN 的 python 实现可以这样做吗?
【问题讨论】:
-
为什么不想在构造函数中使用度量参数?
-
在@Olologin 的评论之后,DBSCAN 的构造函数中的
metric参数接受字符串(对于已经实现的距离)或可调用的(对于给定的 2 个元素返回距离度量的函数)。编写您自己的并使用metric=my_func初始化 DBSCAN。
标签: python scikit-learn cluster-analysis data-mining dbscan