【发布时间】:2011-09-29 15:12:13
【问题描述】:
我有 2 个 11 维的向量。
a <- c(-0.012813841, -0.024518383, -0.002765056, 0.079496744, 0.063928973,
0.476156960, 0.122111977, 0.322930189, 0.400701256, 0.454048860,
0.525526219)
b <- c(0.64175768, 0.54625694, 0.40728261, 0.24819750, 0.09406221,
0.16681692, -0.04211932, -0.07130129, -0.08182200, -0.08266852,
-0.07215885)
cosine_sim <- cosine(a,b)
返回:
-0.05397935
我使用了来自lsa 包的cosine()。
对于某些值,我得到负 cosine_sim 就像给定的一样。我不确定相似性如何可能是负面的。它应该在 0 和 1 之间。
谁能解释一下这里发生了什么。
【问题讨论】:
-
查看维基百科链接了解余弦相似度 (en.wikipedia.org/wiki/Cosine_similarity)。它清楚地表明这些值介于 -1 和 1 之间,-1 表示完全不同,1 表示完全相似。
-
线索就在名字里。三角余弦函数可以取 -1 到 1 之间的值,因此您也希望这个函数也是如此。
-
CrossValidated 上的相同问题:Is it ok to get negative Cosine Similarity using LSA?
标签: r similarity negative-number trigonometry