具有 metric='russellrao' 的 DBSCAN 集群答案

【问题标题】：DBSCAN cluster with metric='russellrao'具有 metric='russellrao' 的 DBSCAN 集群
【发布时间】：2018-09-01 18:21:19
【问题描述】：

我在使用 sklearn.cluster.DBSCAN 时遇到了问题。如果我使用DBSCAN(metric="russellrao")，应该是哪种数据格式？我尝试了两种方法，都返回 pred = [-1 -1 -1 ..., -1 -1 -1] 。可以看到下面的2种数据格式。

npy = df2.values
y_pred = DBSCAN(metric="russellrao").fit_predict(npy)

1。 npy =

2。 npy =

打印 y_pred [-1 -1 -1 ..., -1 -1 -1]

那么，哪种格式是正确的答案？

【问题讨论】：

【解决方案1】：

需要适当地选择其他DBSCAN参数。

恕我直言，sklearn 应该不为它们设置默认值。特别是 epsilon 很大程度上取决于您的数据集和指标，因此默认值几乎总是一个糟糕的选择。与其提供糟糕的默认值，不如强制用户选择参数。

【讨论】：

是的，我知道，但我只是不确定该指标是否有参数“russellrao”。我怎样才能找到所有参数？文档（sklearn.lzjqsdd.com/modules/generated/…）太牛逼了。跨度>
如果您按照兔子进入文档，您可以获得有效支持的指标列表。或者你自己添加。