博弈论(正态-形式博弈)|第一套(介绍)
请在继续之前阅读上述文章。
给定一个支付矩阵。任务是找到玩家的最佳策略。
解决方案:
玩家 A 有 3 种策略——1、2 和 3,玩家 B 也有 3 种策略——1、2 和 3。
- 第 1 步:查找每行的行最小值和每列的列最大值。
20、45、40分别是第一、二、三行的最小值。 58、45、55分别是第一、二、三列的最大值。 - 步骤 2:找到行最小值 (Row Min) 值的最大值和列最大值 (Column Max) 值的最小值。
Row Min 值的最大值称为maximin值,Column Max 值的最小值称为minimax 。这里maximin值等于minimax值,所以这个游戏在第2行和第2列对应的单元格有一个鞍点(见下图)。
因此,游戏 (V) 的值是45 。双方对每种策略的最优概率,
A [P1, P2, P3] = A [0, 1, 0]
B [Q1, Q2, Q3] = B [0, 1, 0]在哪里,
P1,P2和P3是策略1,2和3的概率分别玩家A。
Q1 , Q2和Q3分别是玩家B的策略1 , 2和3 的概率
对于两个玩家,总概率为1 。