【问题标题】:Why am I getting negative value for the Dunn Index when I use Cosine Similarity?为什么当我使用余弦相似度时,邓恩指数会出现负值?
【发布时间】:2019-10-26 16:17:33
【问题描述】:

我使用 k-means 对标准化数据进行聚类。我使用了欧几里得、曼哈顿和余弦等不同的相似度矩阵,当我使用余弦相似度时,邓恩指数得到了一个负值。我读过邓恩指数的值范围从 0 到无穷大。使用余弦相似度计算邓恩指数是否正确?

我用过this implementation of Dunn Index

【问题讨论】:

  • 从互联网下载/复制的代码通常不起作用。你验证了它的正确性吗?
  • 它适用于其他相似度矩阵。
  • 如果您检查该代码上的 cmets,人们并不总是能得到好的结果...

标签: matlab cluster-analysis distance cosine-similarity


【解决方案1】:

欧几里得和曼哈顿是距离。它们可以用来衡量相似度,但它们满足距离的要求。最重要的是,负距离不存在。 0表示相同,值越大表示越不相似。

余弦相似度定义为两个向量之间夹角的余弦值。两个平行向量的相似度为 1,角度差越大,相似度越低。如果两个向量相反,则余弦相似度为-1。

因此,余弦相似度不是距离。因此,您不能在需要距离的地方使用它,例如计算邓恩指数。

【讨论】:

    猜你喜欢
    • 2016-11-20
    • 2016-09-24
    • 2020-08-12
    • 2019-06-21
    • 2011-01-01
    • 2011-09-29
    • 2018-01-28
    • 2017-12-12
    相关资源
    最近更新 更多