一些基本概念及其表示

参与人(player)

博弈中选择行动以最大化自己效用的决策主体(个人、团体、国家、企业、组织)

用$i=1,2,\cdots,n$ 表示$n$人博弈中的参与人,用$\Gamma={1,2,\cdots,n}$表示所有参与人的主体。

行动(action)

参与人在博弈的某个时点的决策变量。

用$a_i$表示参与人$i$的行动,用$A_i={a_i}$表示参与人i所有行动的集合。

$n$个参与人行动的有序集$a={a_1,a_2,\cdots,a_n}$表示$n$个参与人的行动组合或者行动断面(action profile)

用$A$表示所有行动组合的集合。如$A={(a,a),(a,b),(b,a),(b,b)}$

战略(strategy)

战略是参与人的行动规则,即参与人采取什么样的行动,这有一套规则,称之为战略,比如“投资”和“不投资”是两个行动,但是“对方不投资我就投资”和“对方投资我就不投资”这是两个战略。

在$n$人博弈中,用$s_i$表示参与人$i$的战略,用$X_i$表示参与人$i$在决策过程中可能面临的所有决策情形地集合,称之为观测集。

严格地说,战略$s_i$是从观测集$X_i$到行动集$A_i$的映射关系

用$S_i={s_i}$表示参与人$i$所有战略的集合。

在$n$人博弈中,用$s={s_1,s_2,\cdots,s_n}$表示$n$个参与人的战略组合。

用$S={s}$表示所有行动组合的集合。

支付(payoff)

支付指参与人在博弈中的所得。

用$u_i$表示参与人$i$的支付,参与人i的支付不仅与自己的战略有关,也和其他参与人的战略有关,所以:

为了描述方便,用$s{-i}={s_1,\cdots,s{i-1},s{i+1},\cdots,s_n}$表示除了参与人$i$之外的其他参与人的战略组合,则$s={s_1,\cdots,s_n}={s_i,s{-i}}$,故:

支付组合$u=(u_1,u_2,\cdots,u_n)$表示参与人在特定博弈情形下所得到的支付。

信息(information)

信息是参与人所具有的有关博弈的所有知识。

一般假设博弈问题的结构(或者是对博弈问题的描述)和参与人完全理性共同知识

因此,在传统的博弈论中,博弈的主体都是同质的。

战略式博弈的定义

形式Ⅰ

三要素:

  • 参与人集合$\Gamma={1,2,\cdots,n}$;

  • 每位参与人非空的战略集$S_i$,即$\forall i \in \Gamma,\exists S_i \neq \varnothing $;

  • 每位参与人定义在所有战略组合$\prod \limits_{i=1}^n={s=(s_1,\cdots,s_i,\cdots,s_n)}$上的偏好关系$\succ_i$

形式Ⅱ

三要素:

  • 参与人集合$\Gamma={1,2,\cdots,n}$;

  • 每位参与人非空的战略集$S_i$,即$\forall i \in \Gamma,\exists S_i \neq \varnothing $;

  • 每位参与人定义在所有战略组合$\prod \limits_{i=1}^n={s=(s_1,\cdots,s_i,\cdots,s_n)}$上的效用函数$u_i=u_i(s_1,\cdots,s_i,\cdots,s_n)$

对于上述博弈,如果$\left| \Gamma \right|<\infty$ 且$\forall i\in \Gamma$ ,$\left| S_i \right|<\infty $,称该博弈问题为有限博弈(finite game),反u之为无限博弈。

一般用三元组$G=<\Gamma ;\left( S_i \right) ;\left( \succ _i \right) >$或者$G=<\Gamma ;\left( S_i \right) ;\left( u_i \right) >$来表示战略式博弈。

占优行为

占优战略

在$n$人博弈中,如果对于所有其他的参与人的选择$ s{-i}$,$s_i^$都是参与人$i$的最优选择,即对于$\forall s_i \in S_i(s_i \neq s_i^)$,$\forall s{-i}\in \prod \limits_{j=1,j \neq i}^n S_j$,有:

则称$s_i^$为参与人$i$的*占优战略

劣战略

在$n$人博弈中,如果对于参与人$i$,存在战略$s’i,s’’_i \in S_i$,对$\forall s{-i}\in\prod \limits_{j=1,j \neq i}^n S_j$有:

则称战略$s_i’$为参与人$i$的劣战略(严格劣战略),或者说战略$s_i’’$相对$s_i’$占优。

弱劣战略

在$n$人博弈中,如果对于参与人$i$,存在战略$s’i,s’’_i \in S_i$,对$\forall s{-i}\in\prod \limits_{j=1,j \neq i}^n S_j$有:

且$\exists s’{-i}\in\prod \limits{j=1,j \neq i}^n S_j$,使得:

则称战略$s_i’$为参与人$i$的弱劣战略,或者说战略$s_i’’$相对$s_i’$弱占优

为了表述方便,将弱劣战略和严格劣战略统称为劣战略。

在重复剔除劣战略求解博弈问题的过程中,如果每次可以提出的劣战略(包含弱劣战略和严格劣战略)不止一个,那么各个劣战略剔除的顺序不同可能会影响最终得到的博弈结果,除非每次剔除的都是严格劣战略。

如下图所示情形:

b1 b2 b3
a1 3,3 3,1 1,2
a2 1,1 2,0 2,0
a3 3,4 1,3 3,2

重复剔除劣战略的方法

画横线,就看左边的值

画竖线,就看右边的值