博弈论是用于决策的数学模型。它在社会科学的所有领域以及逻辑和计算机科学中都有应用。博弈论已在逻辑和计算机科学中发挥越来越重要的作用。要完全定义,游戏必须指定以下元素:游戏的玩家,每个玩家在每个决策点可用的信息和操作以及每个结果的收益。大多数合作博弈以特征函数形式表示,而广泛形式和正常形式则用于定义非合作博弈。
在博弈论中,正常形式或也称为战略形式,是对游戏的描述。常规(或战略形式)游戏通常由矩阵表示,该矩阵显示玩家,策略和收益。当游戏以正常形式呈现时,假定每个玩家同时行动,或者至少在不了解对方行动的情况下行动。
决策情况
通常,决策情况可以分为三类,如下图所示:
博弈论的基本术语
- 玩家:游戏中通常有两个玩家。例如,玩家A和玩家B,或公司A和公司B。
- 策略:策略是指玩家采取的行动方针,例如,公司将采用不同的策略来增加销售量。通常,游戏内理论有两种策略,第一种是纯策略,第二种是混合策略。如果公司仅选择一个特定策略,而其余策略则称为纯策略,但是这些概率的总和始终等于1(请参见下面的示例)。如果玩家遵循一个以上的策略,则该玩家遵循混合策略,并且选择特定策略或单个策略的概率始终小于1,因此所有概率之和等于1(请参见下面的示例)。
示例:假设有三个策略S1,S2和S3 。
Pure strategy : When the player selects one strategy, lets say S2, then the probability of S2 becomes 1 and the remaining two strategy’s probability will be 0. Hence the total probability’s sum is 0 + 1 + 0 = 1.
Mixed strategy : When a player selects two strategies, let’s say S1 and S3, and their probabilities are given as 0.62 and 0.38 respectively, and the probability of strategy S2 is 0. Hence the total probability’s sum is 0.62 + 0 + 0.38 = 1.
- 收益矩阵:将试样支付矩阵如下所示。有两个参与者,参与者A和参与者B分别具有三种策略,即1、2和3。矩阵中的内部值是不同组合的结果。如果玩家A选择了第三个策略,而玩家B选择了第一个策略,则结果将为35,如果玩家A选择了第二个策略,并且玩家B也选择了第二个策略,则结果将为15。
如果结果为正,则对玩家A是收益,对玩家B是亏损。如果结果为负,则对玩家A是亏损,对玩家B是收益。如果结果为-,则考虑以下支付矩阵: 25,则玩家A失去25分,而玩家B获得25分。 - 马克西姆原理:最大化最小保证收益。
- Minimax原理:最小化最大损失。
- 鞍点:本场比赛将有鞍点,如果最大最小值和极小值相等即交叉点将是相等的。当游戏中没有鞍点时,则说该游戏具有混合策略。
- 游戏的价值:如果游戏具有鞍点,则该单元中鞍点处的结果称为游戏价值。
- 两人零和游戏:在有两个玩家的游戏中,如果一个玩家的收益等于另一个玩家的损失,那么该游戏称为两人零和游戏。为了更好地理解,请参见上面的收益矩阵,如果游戏的结果为40,那么它对玩家A来说是赢家,但对玩家B来说是输家;如果结果为-25,那么对玩家A是一个亏损,但对玩家A是赢家。 B.