博弈论(普通–形式游戏)|设置1(简介)
请先阅读以上文章,然后再继续。
给定回报矩阵。任务是找到玩家的最佳策略。
解决方案:
玩家A有3个策略– 1、2和3,玩家B也有3个策略– 1、2和3。
- 步骤1:查找每一行的行最小值和每一列的列最大值。
第一行,第二行和第三行中的最小值分别为20、45和40。 58、45和55分别是第一,第二和第三栏中的最大值。 - 步骤2:找到行最小值的最大值(行最小值)和列最大值的最小值(列最大值)。
行最小值的最大值称为maximin值,列最大值的最小值称为minimax 。这里的maximin值等于minimax值,因此该游戏在对应于第2行和第2列的单元格处有一个鞍点(请参见下图)。
因此,游戏(V)的值为45 。每种策略的双方参与者的最佳概率,
A [P1, P2, P3] = A [0, 1, 0]
B [Q1, Q2, Q3] = B [0, 1, 0]在哪里,
P1,P2和P3是策略1,2和3的概率分别玩家A。
Q1,Q2和Q3分别为玩家B策略1,2和3的概率
对于这两个玩家,总概率为1 。