【发布时间】:2017-08-09 19:25:27
【问题描述】:
我使用 Elo 和 Glicko 评分系统以及比赛结果来为玩家生成评分。在每场比赛之前,我可以根据每个球员各自的评分为他们生成一个期望值(0 到 1 之间的浮点数)。我想测试一下这个预期有多准确,原因有两个:
- 比较不同的评分系统
- 调整用于计算评分的变量(例如 Elo 中的 kfactor)
与国际象棋有一些不同之处需要注意:
- 可能的结果是获胜(我将其视为 1.0)、失败 (0.0),以及非常偶然的 (
- 玩家的比赛数量较少 - 许多人少于 10 人,少数人超过 25 人,最多 75 人
认为适当的函数是“相关性”,我尝试创建一个 DataFrame,其中包含一列中的预测(0、1 之间的浮点数)和另一列 (1|0.5|0) 中的结果,并使用corr() ,但根据输出,我不确定这是否正确。
如果我创建一个 DataFrame,其中仅包含比赛中第一个玩家的期望和结果(结果将始终为 1.0 或 0.5,因为由于我的数据源,永远不会首先显示失败者), corr() 返回非常低:
如果有帮助,这里有一些真实(非随机)的样本数据:http://pastebin.com/eUzAdNij
【问题讨论】:
-
我认为你应该添加你的代码,否则不容易知道你在做什么
-
也许你应该以正确预测结果的数量作为衡量标准,这里的相关性可能不是那么好
标签: python python-3.x pandas statistics