【问题标题】:Predicting remaining runtime for minimax algorithm with alpha-beta-pruning使用 alpha-beta-pruning 预测 minimax 算法的剩余运行时间
【发布时间】:2020-12-31 14:15:17
【问题描述】:

问题

我正在尝试使用带有 alpha-beta-pruningnegamax 算法来解决完美信息零和游戏(如滴答声或国际象棋)。目标是证明一名球员是否可以强制获胜或平局。这意味着没有深度限制,但算法始终评估游戏树,直到出现胜利/平局。

我花了数周时间针对我的特定游戏优化我的代码,并将其缩短为我会说的几天的运行时间。但问题就在这里:

由于 alpha-beta-pruning,minimax-algorithm 的运行时间是高度不可预测的。我不知道它会在接下来的 5 分钟内完成还是再运行 5 周,直到我真正模拟它为止。我希望能够预测剩余的运行时间,而不是偏离几个数量级。

到目前为止我尝试了什么

我正在记录所有 sub-subsub-branch 的结果,最多 5*sub-branches 以及我花费的时间机器来模拟它们。然后我只是假设同一级别的职位需要相同的时间来评估并收工。这些预测有时会偏离10 倍或更多

我还查看了记录的数据,以了解我的假设是否成立。评估一个5*子分支所需的时间在0.01s180s 之间变化。这就是为什么我的预测不正确的原因。谁会猜到。

我的问题

我想这将适用于 minimax 的所有实现:

  1. 是否有更复杂的算法可以准确预测带有 alpha-beta-pruning 的 minimax-algorithm 的剩余运行时间?还是极小极大只是设计不可预测的?

  2. 如果是,它们是如何工作的?

【问题讨论】:

    标签: algorithm runtime prediction minimax negamax


    【解决方案1】:

    我在Negamax 算法上花了很多时间,我强烈建议您切换到这些算法。它将提供与 Minimax 相同的结果,但更容易调试和进一步优化,因为它只是代码的一半。

    我对您要解决的游戏一无所知,但即使是最复杂的游戏,我认为如果没有超级计算机也无法实现。不过,要回答您的问题:

    1. 带有 alpha-beta 修剪的 Minimax 高度依赖于您尝试移动的顺序(使用棋盘游戏术语)。您想首先尝试最好的移动,这是通过使用例如排序可能的移动功能在国际象棋中完成的。捕获比施放更高。

      您还可以根据您要解决的问题使用不同的技术进一步优化算法。例如换位表,如果相同的位置可以出现在另一个分支中。

    2. 我们需要更多地了解您尝试解决的游戏,以了解哪种算法最有效。

    最后的话:如果你想知道需要多长时间才能解决以及一段时间后你已经走了多远,我建议你使用迭代深化。这也将加快您的搜索速度,因为您可以先尝试先前迭代中的最佳猜测,从而在下一次迭代中获得更快的 beta 截断:

    for depth in range(1, inf):
        score = minimax(alpha, beta, depth....)
        time = elapsed_time()
    

    现在您可以打印每个深度的经过时间,并查看它在特定时间段内的距离。如果您的优化产生任何结果,这也很适合测量。由于每个深度的 Minimax 树都呈指数级增长,因此您可以了解下一个深度需要多长时间。

    因此,如果您知道赢/平/输需要多少步,您就可以很容易地估计通过这种技术是否有可能。

    希望我说清楚,英语不是我的母语 :) 如果有不清楚的地方,请随时在 cmets 中提问。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 2021-05-13
      • 2017-03-22
      • 1970-01-01
      • 2021-10-22
      • 1970-01-01
      • 2018-12-27
      • 1970-01-01
      相关资源
      最近更新 更多