关于博弈的基本常识

王杰卫

一、博弈的分类

博弈可根据不同的分类方式进行划分,例如根据参与者的行动顺序、对其他参与者的了解程度以及是否存在合作关系等进行分类。

1、按照参与者出招的顺序、博弈持续时间和重复次数的角度,博弈可分为静态博弈(Static Game)和动态博弈(Dynamic Game)。 静态博弈指的是各方同时采取策略,而各方的收益则取决于不同的策略组合。因此静态博弈也被称为“同时行动的博弈”(Simultaneous-Move Games)。尽管有时博弈方采取策略有先后之分,但他们并不了解之前其他人所做出的策略。比如在“囚徒困境”中,当罪犯1做出策略后,轮到罪犯2时他并不知道罪犯1所做出的策略。 动态博弈(序贯博弈)指的是参与博弈的方在选择策略时有先后顺序,且能够了解先行动者所选择的策略。

2、从博弈者对其他参与者了解的程度方面,博弈可分为完全信息博弈(Complete Information Game)与不完全信息博弈(Incomplete Information Game),以及完美信息博弈(Perfect Information Game)与不完美信息博弈(Imperfect Information Game),确定的博弈(Certainty Game)与不确定的博弈(Uncertain Game),对称信息博弈(Symmetric Game)与非对称信息博弈(Asymmetric Game)等。 完全信息博弈指的是每个博弈者对其他博弈者的特征、策略空间和收益函数都了解,即所有博弈者都知道博弈者的收益集(Pay offs)。完美信息则指的是博弈者在采取策略时完全知晓其他博弈者的所有策略信息。完美信息涉及到记忆,即博弈者了解博弈过程中的所有信息。如果博弈者在采取策略时观察到的信息节点是唯一的,则表示他对过去信息有完美的记忆;否则,他对之前信息的记忆不完美。因此,完全信息不一定意味着完美信息,而不完全信息则一定不是完美的。 不完全信息博弈指的是某些博弈者对其他博弈者的特征、策略空间和收益函数了解不够全面,或者说并非所有博弈者对这些信息了解充分。在不完全信息博弈中,首先行动的是自然(Nature),自然决定博弈者以何种可能性采取某种策略,而这种可能性只有自然本身知道。确定的博弈则是指不存在由自然做出这种行动的博弈,否则就是不确定的博弈。

3、从博弈者之间是否存在合作关系的角度来看,博弈可分为合作博弈(Cooperative Game)和非合作博弈(Non-Cooperative Game)。 合作博弈指的是博弈者之间有一定程度的合作协议,他们需要在协议允许的范围内进行博弈。例如,两家企业可能通过谈判达成协议,约定各自的产量或价格,以达到共同垄断市场的目的。相反,如果博弈者无法通过谈判达成具有约束力的协议以限制彼此的策略选择,则这种情况被称为非合作博弈。 非合作博弈可以进一步细分为:完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈、不完全信息动态博弈。对应于这些情况的有四种均衡:纳什均衡(Nash Equilibrium)、子博弈精炼纳什均衡(Subgame Perfect Nash Equilibrium)、贝叶斯纳什均衡(Bayesian Nash Equilibrium)、精炼贝叶斯纳什均衡(Perfect Bayesian Nash Equilibrium)。

|| ||

4、根据博弈者的收益情况,博弈可以被归类为零和博弈(Zero-Sum Game)与非零和博弈(Non-Zero-Sum Game),以及常和博弈(Constant-Sum Game)与变和博弈(Variable-Sum Game)。零和博弈已经在先前有所介绍,而非零和博弈指涉的是博弈各方的总收益不为零。常和博弈是指各方的总收益始终保持常数,而变和博弈则是指各方的总收益并非固定不变。

二、博弈中的参与方(博弈方)

1、单人博弈

单人博弈仅涉及一方参与者,可视为一般优化问题。在这种情况下,博弈者在给定条件下选择何种策略以最大化自身收益,而不考虑其他博弈方的影响。单人博弈的分析有助于理解更为复杂的多人博弈。

2、双人博弈

双人博弈由两方构成,例如两人玩猜硬币、囚徒困境等,这类博弈最为普遍。

3、多人博弈

在多人博弈中,参与者达三人或三人以上。每个博弈方独立做出决策,需要在其他博弈者做出反应的情况下找到使自身收益最大化的策略。虽然多人博弈与双人博弈相似,但其复杂性更高,可能存在“破坏者”,其策略选择对自身利益无影响,但对其他博弈者的收益产生影响。

三、博弈中的策略(Strategies)

在博弈中,每个博弈者根据情况做出的决策被称为“策略”,博弈者可选择的所有策略构成“策略空间”。该空间可以是离散或连续的。如果博弈者可选择的策略是可数的,例如在“囚徒困境”中,每个博弈者只有“坦白”和“不坦白”两种策略,这被称为“有限次博弈”,可用收益矩阵、扩展形式等方法表示;如果博弈者可选择的策略是不可数的,例如古诺模型中的连续模型,每个工厂可有无数种策略,这被称为“无限次博弈”,通常以数集或函数形式表示。

四、博弈中的收益(Payoffs)

博弈中的收益是博弈者从中获得的利益,类型多种多样,例如收入、利润、时间或情绪价值等。一般来说,有限次博弈的收益可用收益矩阵表示,而无限次博弈的收益可用收益函数表示。

五、博弈的过程

博弈过程可包含先后、反复或重复的策略对抗。根据博弈过程,可分为“静态博弈”、“动态博弈”和“重复博弈”。

1、静态博弈(Static Games)

静态博弈要求所有参与者同时做出决策。即使决策时间不同,但在做出决策之前,参与者不知道其他博弈者的选择,且在了解其他博弈者决策后也不能改变自身策略。

2、动态博弈(Dynamic Games)

动态博弈中,博弈方的决策有先后顺序。后决策者在做出决策之前可以看到前面博弈者的选择,甚至包括自己的决策。动态博弈也称为“多阶段博弈”。

3、重复博弈(Repeated Games)

重复博弈是指同一博弈进行多次。构成重复博弈的一次性博弈也称为“原博弈”或“阶段博弈”。大多数重复博弈的原博弈是静态博弈,或由静态博弈构成的。重复博弈的最少重复次数为两次,有的重复博弈会进行有限次数,如体育竞技中的多局制比赛,也有的进行无限次数,如市场中企业的竞争。重复博弈的每次博弈之间存在相互影响和制约,无法将其分解为独立的博弈进行分析。

来源: 北京理工大学