algorithm - 了解Minimax的Alpha-Beta修剪版本

我目前正在开发我的第一个关于C ++的项目，并选择使用基于 Minimax 的AI编写Connect Four（aka Score 4），更具体地说，使用Alpha Beta Pruning方法编写。

到目前为止，我知道AB修剪包含一个递归算法，该算法将参数设置为alpha和beta，这些算法是＆＃34;限制＆＃34;在你的游戏树中你不会找到它。此外，我们定义了一个最大化和最小化的玩家，前者是第一个开始玩游戏的玩家。最后，有一个＆＃34;深度＆＃34;我理解为＆＃34;难度级别＆＃34;对于游戏来说，随着AI越深入，它就越能预测到这些动作;因此，计算机赢得比赛的机会就越大。

但是，我的问题如下。假设在某些时候计算机注意到它的对手（人类玩家）有一个3条纹并且远离获胜。因此，我的启发式函数应该返回-infinity，以使AI理解即将来临的危险＆＃34;并使其发挥作用以防止人类玩家获胜：因此递归停止。

但问题在于：当递归停止时，算法会回到游戏的前几层（＆＃34;浅层深度＆＃34;），其中第一个玩家将会读到{{1} }和第二个玩家max(alpha, alphabeta(depth - 1))。这意味着-infinity得分必然会在某个时刻丢失，因此AI可能永远不会理解游戏丢失。

有人可以向我解释一下我在理解这个算法时出错了吗？可以在Wikipedia上找到伪代码的版本。

非常感谢！

了解Minimax的Alpha-Beta修剪版本

1 个答案: