📌  相关文章
📜  博弈论(正态-形式博弈)|第一套(介绍)

📅  最后修改于: 2021-09-24 03:19:48             🧑  作者: Mango

博弈论是一种用于决策的数学模型。它在社会科学以及逻辑和计算机科学的所有领域都有应用。博弈论在逻辑和计算机科学中扮演着越来越重要的角色。要完全定义,游戏必须指定以下元素:游戏的参与者、每个参与者在每个决策点可用的信息和行动,以及每个结果的收益。大多数合作博弈以特征函数形式表示,而广泛和范式用于定义非合作博弈。

在博弈论中,范式或也称为策略形式,是对博弈的一种描述。正常(或战略形式)博弈通常由显示参与者、策略和收益的矩阵表示。当游戏以正常形式呈现时,假定每个玩家同时行动,或者至少不知道对方的行动。

决策情况
一般来说,决策情况可以分为三类,如下图所示:

博弈论的基本术语

  1. 玩家:通常在一个游戏中有两个玩家。例如,玩家 A 和玩家 B,或公司 A 和公司 B。
  2. 策略:策略是指玩家采取的一系列行动,例如,一家公司将有不同的策略来增加销量。一般来说,博弈论有两种策略,第一种是纯策略,第二种是混合策略。如果一家公司只选择一个特定的策略而剩下的策略则称为纯策略,但这些概率的总和始终等于 1(参见下面的示例)。如果玩家遵循多个策略,则称该玩家遵循混合策略,并且选择特定或单个策略的概率始终小于 1,因此所有概率的总和将等于 1 (请参见下面的示例)。

    示例:假设有三个策略S1、S2 和 S3

  3. 收益矩阵:示例收益矩阵如下所示。有两个玩家,玩家 A 和玩家 B,每个玩家有三种策略,即 1、2 和 3。矩阵中的内部值是不同组合的结果。如果玩家A选择第三策略,玩家B选择第一策略,则结果为35,如果玩家A选择第二策略,玩家B也选择第二策略,则结果为15。

    如果结果是正的,那么它是参与者 A 的收益和参与者 B 的损失。如果结果是负的,那么它是参与者 A 的损失和参与者 B 的收益。考虑下面的支付矩阵,如果结果是 – 25 那么玩家 A 失去 25 分,而玩家 B 获得 25 分。
  4. 最大化原则:最大化最小保证收益。
  5. Minimax 原则:最小化最大损失。
  6. 鞍点:本场比赛将有鞍点,如果最大最小值和极小相等即交叉点将是相等的。当游戏中没有鞍点时,则称该游戏具有混合策略。
  7. 游戏价值:如果游戏有鞍点,则鞍点单元格中的结果称为游戏价值。
  8. 二人零和博弈:在两个人的博弈中,如果一个人的收益等于另一人的损失,则该博弈称为二人零和博弈。为了更好地理解,请参见上面的收益矩阵,如果游戏的结果是 40,那么玩家 A 赢了,玩家 B 输了,如果结果是 -25,那么玩家 A 输了,玩家赢了B.

如果您希望与专家一起参加现场课程,请参阅DSA 现场工作专业课程学生竞争性编程现场课程