【发布时间】:2012-01-27 21:26:43
【问题描述】:
Summary
我一直在使用excel 查看澳大利亚规则的历史结果,并关注必发赔率,看看是否有机会更好地预测未来的比赛结果。下面的背景更详细地介绍了我迄今为止的进展。
我现在想更进一步,看看我可能实现的数据挖掘/模式匹配/算法技术。我在使用动态模型(Extend)和在 Excel 中使用 Solver 进行优化方面有一些经验,但除了术语本身之外,我不熟悉数据挖掘
是否有可行的数据挖掘编程技术可供我部署以在 VBA 中进行此分析?
(我意识到这个问题可能被某些人视为边缘问题,但我认为 Stack Overflow 比说 Math 更适合这个问题 - 我很想了解我可以应用的潜在编程选项/算法在 VBA 中)
我的强烈偏好是使用 VBA \ VBscript 来查看它,因为这是我的编码背景,但如果它们明显更好,我愿意接受其他选择。
Background
我已将过去几年澳式足球的数据提取到 Excel 中。这些数据给了我:
- 逐个季度的结果
(例如 WWWL 表示第 1 队在输掉比赛前的前三节领先,DLLL 表示第 1 队和第 2 队在第一节结束时持平,然后是第 2 队在剩下的比赛中领先)。 - 相同的信息被重新组合成一半一半的结果
- 主队和客队(第 1 队在主场,第 2 队在客场)
- 比赛日体育场
- 一年中的月份
然后我将其匹配到其他数据集,例如
- 每周联赛阶梯(已完成)
- 体育场是露天的还是封闭的(已完成)
- 博彩公司赛前赔率(待办)
- 露天体育场的天气条件发生了什么(待办事项)
然后与PivotTables(可能是PowerPivot)进行切分和拼接,以查询这些数据以寻找游戏机会,例如:
- 是否让某些团队比其他团队更频繁地从头到尾领先 (WWWW),并为赢得“第四节”胜利 (WWWW) 的赔率付出不成比例的更多 可能性将表明普通胜利(所以 Lay 普通胜利,Back WWWW)
- 寻找主场和客场表现的显着差异(即主场知识或主场球迷支持是否会导致更多的 ¾ 倍比分逆转)
- 露天体育场与封闭屋顶体育场的比较结果(消除天气影响)
- 一周的长途旅行是否会影响下一周的结果
- 某些球队是否比标准联赛结果更频繁地产生某些得分模式
- 是不是排名较低的球队更有可能在整场比赛中领先而不是落后于排名较高的球队
【问题讨论】:
-
我知道这不能解决您的问题,但我相信它可能会有所帮助。当我学习数据挖掘课程时,我们使用了 Weka (cs.waikato.ac.nz/ml/weka)——它有很多用于数据分析的算法,你可以直接从那里使用它们,或者将它们改编成你的 Java 代码(如果你碰巧知道如何编程Java ..) :)
-
你当然可以在 VBA 中做这样的事情。但是你需要自己做,因为科学界没有人使用 Excel。流行的工具包括 R、Matlab 和 Weka(这是一个 Java 应用程序)
-
@Anony-Mousse 根据我的帖子,我会考虑除 Excel 之外的其他工具,但我的主要兴趣是关于如何分析我的数据集的趋势、异常等方面的建议
-
@brettdj 如果你掌握了正确的趋势,我也想下注 ;)
+1 -
仍在修补 bonCodigo,更多的是为了享受 $。但玩得开心:)
标签: excel algorithm excel data-mining vba