博弈论（正态-形式博弈）|第一套（介绍）

博弈论是一种用于决策的数学模型。它在社会科学以及逻辑和计算机科学的所有领域都有应用。博弈论在逻辑和计算机科学中扮演着越来越重要的角色。要完全定义，游戏必须指定以下元素：游戏的参与者、每个参与者在每个决策点可用的信息和行动，以及每个结果的收益。大多数合作博弈以特征函数形式表示，而广泛和范式用于定义非合作博弈。

在博弈论中，范式或也称为策略形式，是对博弈的一种描述。正常(或战略形式)博弈通常由显示参与者、策略和收益的矩阵表示。当游戏以正常形式呈现时，假定每个玩家同时行动，或者至少不知道对方的行动。

决策情况
一般来说，决策情况可以分为三类，如下图所示：

博弈论的基本术语

玩家：通常在一个游戏中有两个玩家。例如，玩家 A 和玩家 B，或公司 A 和公司 B。
策略：策略是指玩家采取的一系列行动，例如，一家公司将有不同的策略来增加销量。一般来说，博弈论有两种策略，第一种是纯策略，第二种是混合策略。如果一家公司只选择一个特定的策略而剩下的策略则称为纯策略，但这些概率的总和始终等于 1(参见下面的示例)。如果玩家遵循多个策略，则称该玩家遵循混合策略，并且选择特定或单个策略的概率始终小于 1，因此所有概率的总和将等于 1 (请参见下面的示例)。

示例：假设有三个策略S1、S2 和 S3 。

Pure strategy : When the player selects one strategy, lets say S2, then the probability of S2 becomes 1 and the remaining two strategy’s probability will be 0. Hence the total probability’s sum is 0 + 1 + 0 = 1.

Mixed strategy : When a player selects two strategies, let’s say S1 and S3, and their probabilities are given as 0.62 and 0.38 respectively, and the probability of strategy S2 is 0. Hence the total probability’s sum is 0.62 + 0 + 0.38 = 1.

编程需要懂一点英语
收益矩阵：示例收益矩阵如下所示。有两个玩家，玩家 A 和玩家 B，每个玩家有三种策略，即 1、2 和 3。矩阵中的内部值是不同组合的结果。如果玩家A选择第三策略，玩家B选择第一策略，则结果为35，如果玩家A选择第二策略，玩家B也选择第二策略，则结果为15。

如果结果是正的，那么它是参与者 A 的收益和参与者 B 的损失。如果结果是负的，那么它是参与者 A 的损失和参与者 B 的收益。考虑下面的支付矩阵，如果结果是 – 25 那么玩家 A 失去 25 分，而玩家 B 获得 25 分。
最大化原则：最大化最小保证收益。
Minimax 原则：最小化最大损失。
鞍点：本场比赛将有鞍点，如果最大最小值和极小值相等即交叉点将是相等的。当游戏中没有鞍点时，则称该游戏具有混合策略。
游戏价值：如果游戏有鞍点，则鞍点单元格中的结果称为游戏价值。
二人零和博弈：在两个人的博弈中，如果一个人的收益等于另一人的损失，则该博弈称为二人零和博弈。为了更好地理解，请参见上面的收益矩阵，如果游戏的结果是 40，那么玩家 A 赢了，玩家 B 输了，如果结果是 -25，那么玩家 A 输了，玩家赢了B.

如果您希望与专家一起参加现场课程，请参阅DSA 现场工作专业课程和学生竞争性编程现场课程。