【问题标题】:DBSCAN cluster with metric='russellrao'具有 metric='russellrao' 的 DBSCAN 集群
【发布时间】:2018-09-01 18:21:19
【问题描述】:

我在使用 sklearn.cluster.DBSCAN 时遇到了问题。 如果我使用DBSCAN(metric="russellrao"),应该是哪种数据格式? 我尝试了两种方法,都返回 pred = [-1 -1 -1 ..., -1 -1 -1] 。可以看到下面的2种数据格式。

npy = df2.values
y_pred = DBSCAN(metric="russellrao").fit_predict(npy)

1。 npy =

2。 npy =

打印 y_pred [-1 -1 -1 ..., -1 -1 -1]

那么,哪种格式是正确的答案?

【问题讨论】:

  • 欢迎来到 SO,请避免截图,使用复制粘贴并相应地格式化。寻求帮助是没有用的,就字节而言更重,根本不方便。

标签: python scikit-learn cluster-computing dbscan


【解决方案1】:

需要适当地选择其他DBSCAN参数。

恕我直言,sklearn 应该为它们设置默认值。特别是 epsilon 很大程度上取决于您的数据集和指标,因此默认值几乎总是一个糟糕的选择。与其提供糟糕的默认值,不如强制用户选择参数。

【讨论】:

  • 是的,我知道,但我只是不确定该指标是否有参数“russellrao”。我怎样才能找到所有参数?文档(sklearn.lzjqsdd.com/modules/generated/…)太牛逼了。跨度>
  • 如果您按照兔子进入文档,您可以获得有效支持的指标列表。或者你自己添加。
猜你喜欢
  • 2017-01-08
  • 2018-08-29
  • 2018-11-22
  • 2015-08-15
  • 2021-07-07
  • 2020-03-04
  • 2017-05-20
  • 2013-01-15
  • 2016-02-28
相关资源
最近更新 更多