【问题标题】:minimax: what happens if min plays not optimalminimax:如果 min 播放不是最优的会发生什么
【发布时间】:2011-06-10 11:21:13
【问题描述】:

极小极大算法的描述说,两个玩家都必须发挥最佳,因此算法是最佳的。直觉上是可以理解的。但是请任何人具体说明,或证明如果 min 播放不是最佳会发生什么?

谢谢

【问题讨论】:

  • 那么 Max 获胜的机会更大。
  • 澄清一下,如果 min 没有发挥最佳效果,这意味着您没有实现 minimax 算法,而是一个有缺陷的版本。

标签: artificial-intelligence minimax


【解决方案1】:

“最佳”的定义是您玩游戏以最小化对手最佳答案的“分数”(或您衡量的任何东西),该最佳答案由最小化您的最佳答案分数的游戏定义,依此类推.

因此,根据定义,如果您打得不是最佳,那么您的对手至少有一条路径可以让他获得比您打得最佳时的最佳得分更高的分数。

找出什么是最优的一种方法是暴力破解整个游戏树。对于不那么琐碎的问题,您可以使用 alpha-beta 搜索,它可以保证最优而不需要搜索整个树。如果你的树仍然太复杂,你需要一个启发式算法来估计“位置”的得分是多少,并在某个深度停止。

这可以理解吗?

【讨论】:

    【解决方案2】:

    我对那个精确的问题有疑问。

    稍加思考后,您会发现极小极大图包含所有可能的游戏,包括坏游戏。因此,如果玩家玩的是次优游戏,那么该游戏是树的一部分 - 但已被丢弃以支持更好的游戏。

    它类似于 alpha beta。如果我故意牺牲一些棋子来创造空间,然后通过差距取得胜利,我就会陷入困境。即有一个更好的移动到树下。

    使用 alpha beta - 假设在树中实际上是一系列失败的动作,然后是杀手动作 - 但在这种情况下,alpha 和 beta 充当窗口过滤器“a

    在任何情况下,这两种算法都会重新计算每一步,这样如果玩家玩次优游戏,它们就会打开对对手更好的图分支。

    冲洗重复。

    【讨论】:

      【解决方案3】:

      考虑一个 MIN 节点,其子节点是终端节点。如果 MIN 播放不理想,则节点的值大于或等于 MIN 播放最佳时的值。因此,作为 MIN 节点的父节点的 MAX 节点的值只能增加。这个论点可以通过一个简单的归纳一直延伸到根。如果 MIN 的次优策略是可预测的,那么可以比 minimax 策略做得更好。例如,如果 MIN 总是落入某种陷阱并输了,那么设置陷阱保证了胜利,即使实际上对 MIN 造成了毁灭性的反应。

      来源:https://www.studocu.com/en-us/document/university-of-oregon/introduction-to-artificial-intelligence/assignments/solution-2-past-exam-questions-on-computer-information-system/1052571/view

      【讨论】:

        猜你喜欢
        • 2022-01-25
        • 1970-01-01
        • 1970-01-01
        • 2011-03-19
        • 2019-07-06
        • 1970-01-01
        • 2014-04-12
        • 2017-01-29
        • 1970-01-01
        相关资源
        最近更新 更多