📜  AI与Python中的¢Â€A“的游戏- Tutorialspoint

📅  最后修改于: 2020-12-11 05:46:24             🧑  作者: Mango


游戏是一种策略。每个玩家或团队都会在开始游戏之前制定策略,并且他们必须根据游戏的当前情况来更改或建立新策略。

搜索算法

您还必须考虑具有与上述相同策略的计算机游戏。请注意,搜索算法是找出计算机游戏策略的算法。

怎么运行的

搜索算法的目标是找到最佳移动方式,以便它们可以到达最终目的地并获胜。这些算法使用获胜的条件集(每场比赛都不同)来找出最佳动作。

将计算机游戏可视化为树。我们知道树上有节点。从根开始,我们可以到达最终的获胜节点,但要采取最佳措施。那就是搜索算法的工作。这样的树中的每个节点都代表一个未来状态。搜索算法搜索该树以在游戏的每个步骤或节点处做出决策。

组合搜寻

使用搜索算法的主要缺点是它们本质上是详尽无遗的,这就是为什么他们探索整个搜索空间以找到导致资源浪费的解决方案的原因。如果这些算法需要搜索整个搜索空间以找到最终解决方案,则将更加麻烦。

为了消除此类问题,我们可以使用组合搜索,该组合搜索使用启发式方法探索搜索空间,并通过消除可能的错误举动来减小搜索空间的大小。因此,这样的算法可以节省资源。这里讨论了一些使用启发式搜索空间并节省资源的算法-

极小极大算法

组合搜索使用的策略是使用启发式方法来加快搜索策略的速度。可以通过两个玩家游戏的示例来理解Minimax策略的概念,其中每个玩家都试图预测对手的下一步行动并尝试最小化该函数。另外,为了获胜,玩家总是尝试根据当前情况最大化其自身的函数。

启发式算法在诸如Minimax之类的策略中起着重要作用。树的每个节点都将具有与之关联的启发式函数。基于这种启发式方法,将决定朝着最有利于他们的节点前进。

Alpha-Beta修剪

Minimax算法的一个主要问题是它可以探索树上不相关的部分,从而导致资源浪费。因此,必须有一种策略来确定树的哪一部分是相关的,哪一部分是不相关的,并且不进行探索的。 Alpha-Beta修剪就是这样一种策略。

Alpha-Beta修剪算法的主要目标是避免搜索树上那些没有任何解决方案的部分。 Alpha-Beta修剪的主要概念是使用两个界限,分别是最大下界Alpha和最小上界Beta 。这两个参数是限制可能的解决方案集的值。它将当前节点的值与alpha和beta参数的值进行比较,以便它可以移至树中具有解的部分,并丢弃其余部分。

Negamax算法

该算法与Minimax算法没有什么不同,但是它的实现更为优雅。使用Minimax算法的主要缺点是我们需要定义两个不同的启发式函数。这些启发式方法之间的联系是,一个玩家的游戏状态越好,另一玩家的游戏状态越差。在Negamax算法中,借助于单个启发式函数完成两个启发式函数的相同工作。

建立机器人玩游戏

为了使机器人能够在AI中玩两个玩家游戏,我们需要安装easyAI库。这是一个人工智能框架,提供了构建两人游戏的所有功能。您可以在以下命令的帮助下下载它-

pip install easyAI

玩最后一枚硬币的机器人

在这个游戏中,会有一堆硬币。每个玩家必须从那堆硬币中取出一些硬币。游戏的目的是避免拿最后一枚硬币。我们将使用从TwoPlayersGameeasyAI库的继承类LastCoinStanding。以下代码显示了该游戏的Python代码-

导入所需的软件包,如下所示:

from easyAI import TwoPlayersGame, id_solve, Human_Player, AI_Player
from easyAI.AI import TT

现在,从TwoPlayerGame类继承该类以处理游戏的所有操作-

class LastCoin_game(TwoPlayersGame):
   def __init__(self, players):

现在,定义玩家和将要开始游戏的玩家。

self.players = players
self.nplayer = 1

现在,定义游戏中的硬币数量,此处我们使用15个游戏硬币。

self.num_coins = 15

定义玩家可以移动的最大硬币数。

self.max_coins = 4

现在,需要定义一些特定的东西,如以下代码所示。定义可能的动作。

def possible_moves(self):
   return [str(a) for a in range(1, self.max_coins + 1)]

定义硬币的去除

def make_move(self, move):
   self.num_coins -= int(move)

定义谁拿了最后一个硬币。

def win_game(self):
   return self.num_coins <= 0

定义何时停止游戏,即何时获胜。

def is_over(self):
   return self.win()

定义如何计算分数。

def score(self):
   return 100 if self.win_game() else 0

定义堆中剩余的硬币数量。

def show(self):
   print(self.num_coins, 'coins left in the pile')
if __name__ == "__main__":
   tt = TT()
   LastCoin_game.ttentry = lambda self: self.num_coins

使用以下代码块解决游戏-

r, d, m = id_solve(LastCoin_game,
   range(2, 20), win_score=100, tt=tt)
print(r, d, m)

决定谁开始游戏

game = LastCoin_game([AI_Player(tt), Human_Player()])
game.play()

您可以找到以下输出和该游戏的简单玩法-

d:2, a:0, m:1
d:3, a:0, m:1
d:4, a:0, m:1
d:5, a:0, m:1
d:6, a:100, m:4
1 6 4
15 coins left in the pile
Move #1: player 1 plays 4 :
11 coins left in the pile
Player 2 what do you play ? 2
Move #2: player 2 plays 2 :
9 coins left in the pile
Move #3: player 1 plays 3 :
6 coins left in the pile
Player 2 what do you play ? 1
Move #4: player 2 plays 1 :
5 coins left in the pile
Move #5: player 1 plays 4 :
1 coins left in the pile
Player 2 what do you play ? 1
Move #6: player 2 plays 1 :
0 coins left in the pile

玩井字游戏的机器人

井字游戏非常熟悉,是最受欢迎的游戏之一。让我们通过使用Python的easyAI库来创建此游戏。以下代码是该游戏的Python代码-

如图所示导入软件包-

from easyAI import TwoPlayersGame, AI_Player, Negamax
from easyAI.Player import Human_Player

TwoPlayerGame类继承该类以处理游戏的所有操作-

class TicTacToe_game(TwoPlayersGame):
   def __init__(self, players):

现在,定义玩家和将要开始游戏的玩家-

self.players = players
self.nplayer = 1

定义板的类型-

self.board = [0] * 9

现在有一些定义如下:

定义可能的动作

def possible_moves(self):
   return [x + 1 for x, y in enumerate(self.board) if y == 0]

定义玩家的动作-

def make_move(self, move):
   self.board[int(move) - 1] = self.nplayer

为了增强AI,请定义玩家何时行动-

def umake_move(self, move):
   self.board[int(move) - 1] = 0

定义对手连续三局输掉的条件

def condition_for_lose(self):
   possible_combinations = [[1,2,3], [4,5,6], [7,8,9],
      [1,4,7], [2,5,8], [3,6,9], [1,5,9], [3,5,7]]
   return any([all([(self.board[z-1] == self.nopponent)
      for z in combination]) for combination in possible_combinations])

定义比赛结束的检查

def is_over(self):
   return (self.possible_moves() == []) or self.condition_for_lose()

显示玩家在游戏中的当前位置

def show(self):
   print('\n'+'\n'.join([' '.join([['.', 'O', 'X'][self.board[3*j + i]]
      for i in range(3)]) for j in range(3)]))

计算分数。

def scoring(self):
   return -100 if self.condition_for_lose() else 0

定义主要方法以定义算法并开始游戏-

if __name__ == "__main__":
   algo = Negamax(7)
   TicTacToe_game([Human_Player(), AI_Player(algo)]).play()

您可以看到以下输出和该游戏的简单玩法-

. . .
. . .
. . .
Player 1 what do you play ? 1
Move #1: player 1 plays 1 :
O . .
. . .
. . .
Move #2: player 2 plays 5 :
O . .
. X .
121
. . .
Player 1 what do you play ? 3
Move #3: player 1 plays 3 :
O . O
. X .
. . .
Move #4: player 2 plays 2 :
O X O
. X .
. . .
Player 1 what do you play ? 4
Move #5: player 1 plays 4 :
O X O
O X .
. . .
Move #6: player 2 plays 8 :
O X O
O X .
. X .