【问题标题】:In K-Means clustering algorithm(sklearn) how to override euclidean distance to some distance在 K-Means 聚类算法(sklearn)中,如何将欧几里得距离覆盖到某个距离
【发布时间】:2019-05-04 13:37:50
【问题描述】:

我有一些文档,我只想对相关文档进行分组。目前我正在使用谷歌的新闻矢量文件(GoogleNews-vectors-negative300.bin),通过这个矢量文件,我得到了矢量,我使用 WMD(Word Mover Distance)算法来获取两个文档之间的距离。现在我想将它与 K-means 聚类集成。基本上我想覆盖 KMeans 中的距离计算功能。我怎样才能做到这一点?任何建议都是最受欢迎的。提前致谢。

【问题讨论】:

    标签: machine-learning scikit-learn k-means euclidean-distance wmd


    【解决方案1】:

    虽然理论上可以使用其他距离度量来实现 k-means,但不建议这样做 - 您的算法可能会停止收敛。可以找到更详细的讨论,例如在StackExchange。这就是 scikit-learn 没有其他距离指标的原因。

    我建议使用例如层次聚类,可以插入任意距离函数。

    【讨论】:

      猜你喜欢
      • 2019-05-07
      • 2018-09-30
      • 1970-01-01
      • 2013-03-02
      • 2016-11-05
      • 1970-01-01
      • 2019-03-08
      相关资源
      最近更新 更多