考虑以下关于参与者 A 的支付矩阵并对其进行最佳求解。
解决方案:
如果游戏没有鞍点,则称该游戏具有混合策略。
- 步骤1:找出行最小值和列最大值。
- 第 2 步:找出极大极小值和极大极小值。
由于这个游戏的极大极小值和极大极小值不相等,所以这个游戏没有鞍点。 - 第 3 步:现在取 2×2 矩阵并找出行和列的奇数。
奇数:取第一行的最高结果和最小结果的差,放在第二行的右边(见上图),即9和7的差为2,放在第二行的右边。同理,取第二行最高和最低结果的差,放在第一行的右边,即11和5的差为6,放在第一行的右边。同样,也可以找到列的奇数。取一列的较大和较小结果之间的差异,并将其放在另一列的底部。 11 – 7 = 4 放在第一列的底部,而 9 – 5 = 4 放在第二列的底部。 - 第 4 步:现在找到每一行的概率。
使用公式
设x和(1-x)为参与者A选择策略的概率,y和(1-y)为参与者B选择策略的概率,则
和,
不使用公式
计算概率:对应的奇数/行或列奇数的总和,即
对于 P1,第 1 行的奇数值为 6,两行奇数值之和为 8,因此 P1 = 6/(6+2) = 3/4
对于 P2,第 2 行的奇数值为 2,两行奇数值之和为 8,所以 P2 = 2/(6+2) = 1/4
对于 Q1,第 1 列的奇数值为 4,两列奇数值之和为 8,因此 Q1 = 4/(4+4) = 1/2
对于 Q2,第 2 列的奇数值为 4,两列奇数值之和为 8,因此 Q2 = 4/(4+4) = 1/2 - 第五步:找到游戏的价值。
使用公式
不使用公式
有4种方法可以找到游戏的价值。
取第一列。现在将第一列的元素与相应的行奇数相乘,然后将两个乘法相加,然后除以行的总奇数。
V = (9*6 + 5*2) / (6 + 2) = (54 + 10) / 8 = 64 / 8 = 8。
要么,
取第二列。现在将第二列的元素与相应的行奇数相乘,然后将两个乘法相加,然后除以行的总奇数。
V = (7*6 + 11*2) / (6+2) = (42 + 22) / 8 = 64 / 8 = 8。
要么,
取第一排。现在将第一行的元素与相应的列奇数相乘,然后将两个乘法相加,然后除以列的总奇数。
V = (9*4 + 7*4) / (4 + 4) = (36 + 28) / 8 = 64 / 8 = 8。
要么,
拿第二排。现在将第二行的元素与相应的列奇数相乘,然后将两个乘法相加,然后除以列的总奇数。
V = (5*4 + 11*4) / (4 + 4) = (20 + 44) / 8 = 64 / 8 = 8。 - Step 6:因此,玩家 A 的策略是(3/4, 1/4),玩家 B 的策略是(1/2, 1/2),博弈的值为 V = 8。每个玩家选择每种策略的概率小于 1,但每个玩家的总概率为 1。玩家 A 的总概率为 3/4 + 1/4 = 1,玩家 B 的总概率为 1/2 + 1/2 = 1。