【发布时间】:2017-05-20 03:33:13
【问题描述】:
我在 python 中使用来自 sklearn 的 DBSCAN 来聚类一些数据点。我正在使用预先计算的距离矩阵对点进行聚类。
import sklearn.cluster as cl
C = cl.DBSCAN(eps = 2, metric = 'precomputed', min_samples =2)
db = C.fit(Dist_Matrix)
Dist_Matrix 是我正在使用的预先计算的距离矩阵。每次运行代码时,我都会为数据点获得不同的集群标签。集群的数量也在变化 就像,在第一次运行中,标签是
[ 2 3 3 0 3 0 2 2 2 4 2 -1 0 0 0 1 4 0 1 0 1 3 0 3 0
0 1 -1 0 3 1 3 0 0 2 0 2 0 -1 0 0 3 0 0 0 1 0 1 0 0]
在另一个运行中,它就像
[ 0 2 2 1 2 1 0 0 0 3 0 -1 1 1 1 0 3 1 0 1 0 2 1 2 1
1 0 -1 1 2 0 2 1 1 0 1 0 1 -1 1 1 2 1 1 1 0 1 0 1 1]
我该如何解决这个问题?请帮忙
【问题讨论】:
-
min_samples=2太小。你在做单链接,而不是 DBSCAN!