博弈论(普通形式的博弈)|套装2(具有纯策略的游戏) - 芒果文档

📌 相关文章

📜 博弈论(普通形式的博弈)|套装2(具有纯策略的游戏)

📅 最后修改于: 2021-04-29 17:11:03 🧑 作者: Mango

博弈论(普通–形式游戏)|设置1(简介)

请先阅读以上文章，然后再继续。

给定回报矩阵。任务是找到玩家的最佳策略。

解决方案：
玩家A有3个策略– 1、2和3，玩家B也有3个策略– 1、2和3。

步骤1：查找每一行的行最小值和每一列的列最大值。

第一行，第二行和第三行中的最小值分别为20、45和40。 58、45和55分别是第一，第二和第三栏中的最大值。
步骤2：找到行最小值的最大值(行最小值)和列最大值的最小值(列最大值)。

行最小值的最大值称为maximin值，列最大值的最小值称为minimax 。
这里的maximin值等于minimax值，因此该游戏在对应于第2行和第2列的单元格处有一个鞍点(请参见下图)。

因此，游戏(V)的值为45 。每种策略的双方参与者的最佳概率，

A [P1, P2, P3] = A [0, 1, 0]
B [Q1, Q2, Q3] = B [0, 1, 0]

为什么编程需要懂一点英语

在哪里，
P1，P2和P3是策略1，2和3的概率分别玩家A。
Q1，Q2和Q3分别为玩家B策略1，2和3的概率
对于这两个玩家，总概率为1 。