肯德尔距离和肯德尔 tau 距离有什么区别？答案

【问题标题】：What's the Difference Between Kendall's Distance and Kendall tau Distance?肯德尔距离和肯德尔 tau 距离有什么区别？
【发布时间】：2019-07-03 07:48:26
【问题描述】：

我现在正在尝试使用 Kendall 的距离来改进基于 Borda 计数方法的排名。

我被要求遵循特定文档的说明。在文件中指出：

“Kendall 距离将两个排名中的项目之间的成对分歧计算为：

在哪里

Kendall 距离通过其最大值 C2n 进行归一化。 Kendall距离越小，排名之间的相似度越大。

Kendall's tau 是衡量排名间相似度的另一种方法，容易与 Kendall's distance 混淆。 Kendall 的 tau 定义为：

Kendall 的 tau 是根据标准化的 Kendall 距离定义的。请注意，Kendall 的 tau 越大，所比较的排名之间的相似度就越大。在本文中，我们使用 Kendall 距离而不是 Kendall tau。”

我的目标是通过使用 Kendall 的距离来提高以下排名：

    x1 x2 x3 x4
A1  4  1  3  2
A2  4  1  3  2
A3  4  3  2  1
A4  1  4  3  2
A5  1  2  4  3

在本次排名中，第i行表示根据Ai得到的排名，每一列表示对应item在每次排名中的排名位置。（即 xn 表示要排序的项目，Ai 表示对项目进行排序的项目。）

尽管有文档的解释，但我不明白这两个距离之间有什么区别。 sigma 符号下方的“(j,s), j != s”代表什么？最后如何在上面提供的排名中实现 Kendall 距离？

【问题讨论】：

标签： algorithm aggregate distance aggregation ranking

【解决方案1】：

距离和相似度是两个相关的概念，但是对于距离来说，确切的同一性意味着距离为0，随着事物的不同，它们之间的距离也越来越大，没有很明显的固定界限。行为良好的距离将遵守度量规则 - 请参阅https://en.wikipedia.org/wiki/Metric_(mathematics)。对于相似度，精确同一性意味着相似度为 1，而相似度会随着事物的增大而减小，但通常不会低于 0。Kendall 的 tau 似乎是将 Kendall 的距离转化为相似度的一种方式。

"(j,s), j != s" 表示考虑 j 和 s 的所有可能性，除了 j = s 的可能性。

您可以通过简单地将 j 不等于 s 的所有可能性相加来计算 Kendall 距离 - 但是这样做所花费的时间会随着项目数的平方而增加。有些方法所花费的时间只会增加 n * log(n) 其中 n 是项目数 - 对于这个和 Kendall 上的许多其他内容，请参阅https://en.wikipedia.org/wiki/Kendall_rank_correlation_coefficient

【讨论】：

您好，谢谢您的解释，现在我了解更多了。但是，Kendall的距离好像只能用二元排名？我需要计算 3 或 4 元素排名之间的排名距离。例如，我需要计算一个 4 元素排名r = [3 2 4 1] 与上述排名的每一行之间的距离。是否可以判断包含两个以上元素的排名是一致还是不一致？
Kendall 的 tau 给出了大小为 n 的两个排名之间的距离，其中 n 确实可以是 4，或者实际上是更大的值。 encyclopediaofmath.org/index.php/… 专门讨论 4 到 10 之间的 n，以及大于 10 的 n。我在网络上找不到详细说明此问题的文本示例，但网络搜索也能找到解释性视频我没看过。也许其中之一会对您有所帮助。
我已经想通了哈哈，现在我没有问题了。但是谢谢你。