【发布时间】:2019-05-04 13:37:50
【问题描述】:
我有一些文档,我只想对相关文档进行分组。目前我正在使用谷歌的新闻矢量文件(GoogleNews-vectors-negative300.bin),通过这个矢量文件,我得到了矢量,我使用 WMD(Word Mover Distance)算法来获取两个文档之间的距离。现在我想将它与 K-means 聚类集成。基本上我想覆盖 KMeans 中的距离计算功能。我怎样才能做到这一点?任何建议都是最受欢迎的。提前致谢。
【问题讨论】:
标签: machine-learning scikit-learn k-means euclidean-distance wmd