【问题标题】:What's the Difference Between Kendall's Distance and Kendall tau Distance?肯德尔距离和肯德尔 tau 距离有什么区别?
【发布时间】:2019-07-03 07:48:26
【问题描述】:

我现在正在尝试使用 Kendall 的距离来改进基于 Borda 计数方法的排名。

我被要求遵循特定文档的说明。在文件中指出:

“Kendall 距离将两个排名中的项目之间的成对分歧计算为:

在哪里

Kendall 距离通过其最大值 C2n 进行归一化。 Kendall距离越小,排名之间的相似度越大。

Kendall's tau 是衡量排名间相似度的另一种方法,容易与 Kendall's distance 混淆。 Kendall 的 tau 定义为:

Kendall 的 tau 是根据标准化的 Kendall 距离定义的。请注意,Kendall 的 tau 越大,所比较的排名之间的相似度就越大。在本文中,我们使用 Kendall 距离而不是 Kendall tau。”

我的目标是通过使用 Kendall 的距离来提高以下排名:

    x1 x2 x3 x4
A1  4  1  3  2
A2  4  1  3  2
A3  4  3  2  1
A4  1  4  3  2
A5  1  2  4  3

在本次排名中,第i行表示根据Ai得到的排名,每一列表示对应item在每次排名中的排名位置。 (即 xn 表示要排序的项目,Ai 表示对项目进行排序的项目。)

尽管有文档的解释,但我不明白这两个距离之间有什么区别。 sigma 符号下方的“(j,s), j != s”代表什么?最后如何在上面提供的排名中实现 Kendall 距离?

【问题讨论】:

    标签: algorithm aggregate distance aggregation ranking


    【解决方案1】:

    距离和相似度是两个相关的概念,但是对于距离来说,确切的同一性意味着距离为0,随着事物的不同,它们之间的距离也越来越大,没有很明显的固定界限。行为良好的距离将遵守度量规则 - 请参阅https://en.wikipedia.org/wiki/Metric_(mathematics)。对于相似度,精确同一性意味着相似度为 1,而相似度会随着事物的增大而减小,但通常不会低于 0。Kendall 的 tau 似乎是将 Kendall 的距离转化为相似度的一种方式。

    "(j,s), j != s" 表示考虑 j 和 s 的所有可能性,除了 j = s 的可能性。

    您可以通过简单地将 j 不等于 s 的所有可能性相加来计算 Kendall 距离 - 但是这样做所花费的时间会随着项目数的平方而增加。有些方法所花费的时间只会增加 n * log(n) 其中 n 是项目数 - 对于这个和 Kendall 上的许多其他内容,请参阅https://en.wikipedia.org/wiki/Kendall_rank_correlation_coefficient

    【讨论】:

    • 您好,谢谢您的解释,现在我了解更多了。但是,Kendall的距离好像只能用二元排名?我需要计算 3 或 4 元素排名之间的排名距离。例如,我需要计算一个 4 元素排名r = [3 2 4 1] 与上述排名的每一行之间的距离。是否可以判断包含两个以上元素的排名是一致还是不一致?
    • Kendall 的 tau 给出了大小为 n 的两个排名之间的距离,其中 n 确实可以是 4,或者实际上是更大的值。 encyclopediaofmath.org/index.php/… 专门讨论 4 到 10 之间的 n,以及大于 10 的 n。我在网络上找不到详细说明此问题的文本示例,但网络搜索也能找到解释性视频我没看过。也许其中之一会对您有所帮助。
    • 我已经想通了哈哈,现在我没有问题了。但是谢谢你。
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2022-01-18
    • 2016-08-15
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2016-06-24
    相关资源
    最近更新 更多