【发布时间】:2019-07-03 07:48:26
【问题描述】:
我现在正在尝试使用 Kendall 的距离来改进基于 Borda 计数方法的排名。
我被要求遵循特定文档的说明。在文件中指出:
“Kendall 距离将两个排名中的项目之间的成对分歧计算为:
在哪里
Kendall 距离通过其最大值 C2n 进行归一化。 Kendall距离越小,排名之间的相似度越大。
Kendall's tau 是衡量排名间相似度的另一种方法,容易与 Kendall's distance 混淆。 Kendall 的 tau 定义为:
Kendall 的 tau 是根据标准化的 Kendall 距离定义的。请注意,Kendall 的 tau 越大,所比较的排名之间的相似度就越大。在本文中,我们使用 Kendall 距离而不是 Kendall tau。”
我的目标是通过使用 Kendall 的距离来提高以下排名:
x1 x2 x3 x4
A1 4 1 3 2
A2 4 1 3 2
A3 4 3 2 1
A4 1 4 3 2
A5 1 2 4 3
在本次排名中,第i行表示根据Ai得到的排名,每一列表示对应item在每次排名中的排名位置。 (即 xn 表示要排序的项目,Ai 表示对项目进行排序的项目。)
尽管有文档的解释,但我不明白这两个距离之间有什么区别。 sigma 符号下方的“(j,s), j != s”代表什么?最后如何在上面提供的排名中实现 Kendall 距离?
【问题讨论】:
标签: algorithm aggregate distance aggregation ranking