📜  博弈论(普通–形式游戏)|设置1(简介)

📅  最后修改于: 2021-04-24 03:35:03             🧑  作者: Mango

博弈论是用于决策的数学模型。它在社会科学的所有领域以及逻辑和计算机科学中都有应用。博弈论已在逻辑和计算机科学中发挥越来越重要的作用。要完全定义,游戏必须指定以下元素:游戏的玩家,每个玩家在每个决策点可用的信息和操作以及每个结果的收益。大多数合作博弈以特征函数形式表示,而广泛形式和正常形式则用于定义非合作博弈。

在博弈论中,正常形式或也称为战略形式,是对游戏的描述。常规(或战略形式)游戏通常由矩阵表示,该矩阵显示玩家,策略和收益。当游戏以正常形式呈现时,假定每个玩家同时行动,或者至少在不了解对方行动的情况下行动。

决策情况
通常,决策情况可以分为三类,如下图所示:

博弈论的基本术语

  1. 玩家:游戏中通常有两个玩家。例如,玩家A和玩家B,或公司A和公司B。
  2. 策略:策略是指玩家采取的行动方针,例如,公司将采用不同的策略来增加销售量。通常,游戏内理论有两种策略,第一种是纯策略,第二种是混合策略。如果公司仅选择一个特定策略,而其余策略则称为纯策略,但是这些概率的总和始终等于1(请参见下面的示例)。如果玩家遵循一个以上的策略,则该玩家遵循混合策略,并且选择特定策略或单个策略的概率始终小于1,因此所有概率之和等于1(请参见下面的示例)。

    示例:假设有三个策略S1,S2和S3

  3. 收益矩阵:将试样支付矩阵如下所示。有两个参与者,参与者A和参与者B分别具有三种策略,即1、2和3。矩阵中的内部值是不同组合的结果。如果玩家A选择了第三个策略,而玩家B选择了第一个策略,则结果将为35,如果玩家A选择了第二个策略,并且玩家B也选择了第二个策略,则结果将为15。

    如果结果为正,则对玩家A是收益,对玩家B是亏损。如果结果为负,则对玩家A是亏损,对玩家B是收益。如果结果为-,则考虑以下支付矩阵: 25,则玩家A失去25分,而玩家B获得25分。
  4. 马克西姆原理:最大化最小保证收益。
  5. Minimax原理:最小化最大损失。
  6. 鞍点:本场比赛将有鞍点,如果最大最小值和极小相等即交叉点将是相等的。当游戏中没有鞍点时,则说该游戏具有混合策略。
  7. 游戏的价值:如果游戏具有鞍点,则该单元中鞍点处的结果称为游戏价值。
  8. 两人零和游戏:在有两个玩家的游戏中,如果一个玩家的收益等于另一个玩家的损失,那么该游戏称为两人零和游戏。为了更好地理解,请参见上面的收益矩阵,如果游戏的结果为40,那么它对玩家A来说是赢家,但对玩家B来说是输家;如果结果为-25,那么对玩家A是一个亏损,但对玩家A是赢家。 B.