2 * N游戏的收益矩阵由2 行N 列组成。本文将讨论如何通过图形方法解决一个2 * N游戏。
考虑下面的 2 * 5 游戏:
解决方法:首先检查游戏的鞍点。这个游戏没有鞍点。
第 1 步:通过应用优势属性来减小支付矩阵的大小(如果存在)。这一步不是强制性的。正在缩小尺寸以简化问题。游戏也可以在不减小尺寸的情况下解决。
借助优势属性简化上述博弈后,我们得到以下博弈。
第 2 步:设x是玩家 A 选择备选方案 1 的概率,而(1 – x)是玩家 A 选择备选方案 2 的概率。
推导出参与者 A 相对于参与者 B 的每个备选方案的预期增益函数。为此,只需将 B 的备选方案的列值与其相应的参与者 A 选择备选方案的概率相乘。例如,参与者的第一个备选方案B 是第 1 列,因此将-4与x和3与(1 – x)相乘,然后将它们相加,然后获得的表达式就是 A 的预期收益函数。类似地,玩家 B 的第二个选择是第 2 列,因此将2与x和-9与(1 – x)相乘并将它们相加。同样,玩家 B 的第三个选择是列号 4,因此将-6乘以x ,将4乘以(1 – x)并将它们相加。请参考所示表格。
步骤 3:找出x = 0和x = 1时的增益值。见下表:
第 4 步:现在通过假设合适的比例在图形上绘制增益函数。 [x 轴为 x,y 轴为增益]
如果B选择第一个备选方案,即第一个策略,当x = 0 时, A 的预期增益为3,而当x = 1 时, A 的预期增益为-4 。
如果B选择第二个备选方案,即第二个策略,当x = 0 时, A 的预期增益为-9,而当x = 1 时, A 的预期增益为2 。
如果B选择第三种选择,即第四种策略,则当x = 0 时, A 的预期增益为4,而当x = 1 时, A 的预期增益为-6 。
使用上述信息绘制图形。
第五步:在图的下边界找到最高的交点->最大点,因为A是Maximin player 。
下边界是ABC。而A、B、C中的最高点是B。这个交点B称为Maximin点。
Step 6:如果通过最大值点的行数只有两条,则形成 2 * 2 的支付矩阵,然后按照本文解决博弈。
如果不是,请确定通过该点的具有相反斜率的任何两条线。形成一个2*2的支付矩阵然后求解。这一点将在下一篇文章中讨论。
由于我们有两条线通过这一点,使用 B1 和 B2 替代方案的收益矩阵是:
现在使用本文中讨论的方法解决游戏。
玩家 A 的概率 = [13/21, 8/21]
玩家 B 的概率 = [0, 10/21, 0, 11/21, 0]
而游戏的价值是-46/21
如果您希望与专家一起参加现场课程,请参阅DSA 现场工作专业课程和学生竞争性编程现场课程。