【问题标题】:Programmatic techniques to detect trends in historical sports match data检测历史体育比赛数据趋势的程序化技术
【发布时间】:2012-01-27 21:26:43
【问题描述】:

Summary

我一直在使用 查看澳大利亚规则的历史结果,并关注必发赔率,看看是否有机会更好地预测未来的比赛结果。下面的背景更详细地介绍了我迄今为止的进展。

我现在想更进一步,看看我可能实现的数据挖掘/模式匹配/算法技术。我在使用动态模型(Extend)和在 Excel 中使用 Solver 进行优化方面有一些经验,但除了术语本身之外,我不熟悉数据挖掘

是否有可行的数据挖掘编程技术可供我部署以在 VBA 中进行此分析?

(我意识到这个问题可能被某些人视为边缘问题,但我认为 Stack Overflow 比说 Math 更适合这个问题 - 我很想了解我可以应用的潜在编程选项/算法在 VBA 中)

我的强烈偏好是使用 VBA \ VBscript 来查看它,因为这是我的编码背景,但如果它们明显更好,我愿意接受其他选择。

Background

我已将过去几年澳式足球的数据提取到 Excel 中。这些数据给了我:

  1. 逐个季度的结果
    (例如 WWWL 表示第 1 队在输掉比赛前的前三节领先,DLLL 表示第 1 队和第 2 队在第一节结束时持平,然后是第 2 队在剩下的比赛中领先)。
  2. 相同的信息被重新组合成一半一半的结果
  3. 主队和客队(第 1 队在主场,第 2 队在客场)
  4. 比赛日体育场
  5. 一年中的月份

然后我将其匹配到其他数据集,例如

  1. 每周联赛阶梯(已完成)
  2. 体育场是露天的还是封闭的(已完成)
  3. 博彩公司赛前赔率(待办)
  4. 露天体育场的天气条件发生了什么(待办事项)

然后与PivotTables(可能是PowerPivot)进行切分和拼接,以查询这些数据以寻找游戏机会,例如:

  • 是否让某些团队比其他团队更频繁地从头到尾领先 (WWWW),并为赢得“第四节”胜利 (WWWW) 的赔率付出不成比例的更多 可能性将表明普通胜利(所以 Lay 普通胜利,Back WWWW)
  • 寻找主场和客场表现的显着差异(即主场知识或主场球迷支持是否会导致更多的 ¾ 倍比分逆转)
  • 露天体育场与封闭屋顶体育场的比较结果(消除天气影响)
  • 一周的长途旅行是否会影响下一周的结果
  • 某些球队是否比标准联赛结果更频繁地产生某些得分模式
  • 是不是排名较低的球队更有可能在整场比赛中领先而不是落后于排名较高的球队

【问题讨论】:

  • 我知道这不能解决您的问题,但我相信它可能会有所帮助。当我学习数据挖掘课程时,我们使用了 Weka (cs.waikato.ac.nz/ml/weka)——它有很多用于数据分析的算法,你可以直接从那里使用它们,或者将它们改编成你的 Java 代码(如果你碰巧知道如何编程Java ..) :)
  • 你当然可以在 VBA 中做这样的事情。但是你需要自己做,因为科学界没有人使用 Excel。流行的工具包括 R、Matlab 和 Weka(这是一个 Java 应用程序)
  • @Anony-Mousse 根据我的帖子,我会考虑除 Excel 之外的其他工具,但我的主要兴趣是关于如何分析我的数据集的趋势、异常等方面的建议
  • @brettdj 如果你掌握了正确的趋势,我也想下注 ;) +1
  • 仍在修补 bonCodigo,更多的是为了享受 $。但玩得开心:)

标签: excel algorithm excel data-mining vba


【解决方案1】:

查看 rapid miner,它有许多内置工具来探索您的数据。假设您有能力使用计算机工具,还可以查看 Weka,它是一种机器学习工具。如果您对数据进行注释,您可以在数据上训练算法,看看哪个在预测获胜者方面最准确。

例如 A 队与 B 队比赛,您基本上必须在 csv 文件中表示比赛的流程,任何其他统计数据以及同一行,然后在最后一个选项卡中显示哪支球队获胜。你说哪支球队获胜的部分是用来训练的。

【讨论】:

  • 谢谢史蒂夫 - 我会调查这个(+1 为您的回复)。我会再等一会儿,看看我是否得到任何进一步的回复
【解决方案2】:

这篇文章有点晚了,但只是想在过程本身上加上我的 2 美分。

根据我(相当广泛的)在此类市场(包括必发)上运行预测算法的工作,我的结论是预测事件发生(返回)或不发生(未发生)的概率是没有用的。问题是,即使您能够以高准确率清楚地识别趋势,由于市场赔率,您仍然无法从预测中获利。赔率有效地将概率倾斜到 50/50。 事实上,市场赔率本身会告诉您事件发生的隐含概率。

隐含概率%= (1/(odds - 1 ))

例如:如果 Back-Draw 是 4.1;这实际上意味着 32.25% 的平局机会。

要有效地从必发获利,需要关注市场赔率的差异,而不是关注事件发生的概率。示例:由于赔率的快速市场变动,可能(短暂)存在跨市场赔率倾向于提供 >100% 回报的情况。这不会发生在重大比赛中。主要用于小批量比赛。

【讨论】:

  • p/s:如果您为此目的训练神经网络(人工智能),请务必将该交易的赔率和盈亏作为一个因素;否则,您将/可能会遇到可以准确预测结果但仍会赔钱的情况。祝你好运!
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2021-11-21
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多