Game theory-Strategic game
一些基本概念及其表示
参与人(player)
博弈中选择行动以最大化自己效用的决策主体(个人、团体、国家、企业、组织)
用$i=1,2,\cdots,n$ 表示$n$人博弈中的参与人,用$\Gamma={1,2,\cdots,n}$表示所有参与人的主体。
行动(action)
参与人在博弈的某个时点的决策变量。
用$a_i$表示参与人$i$的行动,用$A_i={a_i}$表示参与人i所有行动的集合。
$n$个参与人行动的有序集$a={a_1,a_2,\cdots,a_n}$表示$n$个参与人的行动组合或者行动断面(action profile)
用$A$表示所有行动组合的集合。如$A={(a,a),(a,b),(b,a),(b,b)}$
战略(strategy)
战略是参与人的行动规则,即参与人采取什么样的行动,这有一套规则,称之为战略,比如“投资”和“不投资”是两个行动,但是“对方不投资我就投资”和“对方投资我就不投资”这是两个战略。
在$n$人博弈中,用$s_i$表示参与人$i$的战略,用$X_i$表示参与人$i$在决策过程中可能面临的所有决策情形地集合,称之为观测集。
严格地说,战略$s_i$是从观测集$X_i$到行动集$A_i$的映射关系:
用$S_i={s_i}$表示参与人$i$所有战略的集合。
在$n$人博弈中,用$s={s_1,s_2,\cdots,s_n}$表示$n$个参与人的战略组合。
用$S={s}$表示所有行动组合的集合。
支付(payoff)
支付指参与人在博弈中的所得。
用$u_i$表示参与人$i$的支付,参与人i的支付不仅与自己的战略有关,也和其他参与人的战略有关,所以:
为了描述方便,用$s{-i}={s_1,\cdots,s{i-1},s{i+1},\cdots,s_n}$表示除了参与人$i$之外的其他参与人的战略组合,则$s={s_1,\cdots,s_n}={s_i,s{-i}}$,故:
用支付组合$u=(u_1,u_2,\cdots,u_n)$表示参与人在特定博弈情形下所得到的支付。
信息(information)
信息是参与人所具有的有关博弈的所有知识。
一般假设博弈问题的结构(或者是对博弈问题的描述)和参与人完全理性是共同知识。
因此,在传统的博弈论中,博弈的主体都是同质的。
战略式博弈的定义
形式Ⅰ
三要素:
参与人集合$\Gamma={1,2,\cdots,n}$;
每位参与人非空的战略集$S_i$,即$\forall i \in \Gamma,\exists S_i \neq \varnothing $;
- 每位参与人定义在所有战略组合$\prod \limits_{i=1}^n={s=(s_1,\cdots,s_i,\cdots,s_n)}$上的偏好关系$\succ_i$
形式Ⅱ
三要素:
参与人集合$\Gamma={1,2,\cdots,n}$;
每位参与人非空的战略集$S_i$,即$\forall i \in \Gamma,\exists S_i \neq \varnothing $;
- 每位参与人定义在所有战略组合$\prod \limits_{i=1}^n={s=(s_1,\cdots,s_i,\cdots,s_n)}$上的效用函数$u_i=u_i(s_1,\cdots,s_i,\cdots,s_n)$
对于上述博弈,如果$\left| \Gamma \right|<\infty$ 且$\forall i\in \Gamma$ ,$\left| S_i \right|<\infty $,称该博弈问题为有限博弈(finite game),反u之为无限博弈。
一般用三元组$G=<\Gamma ;\left( S_i \right) ;\left( \succ _i \right) >$或者$G=<\Gamma ;\left( S_i \right) ;\left( u_i \right) >$来表示战略式博弈。
占优行为
占优战略
在$n$人博弈中,如果对于所有其他的参与人的选择$ s{-i}$,$s_i^$都是参与人$i$的最优选择,即对于$\forall s_i \in S_i(s_i \neq s_i^)$,$\forall s{-i}\in \prod \limits_{j=1,j \neq i}^n S_j$,有:
则称$s_i^$为参与人$i$的*占优战略。
劣战略
在$n$人博弈中,如果对于参与人$i$,存在战略$s’i,s’’_i \in S_i$,对$\forall s{-i}\in\prod \limits_{j=1,j \neq i}^n S_j$有:
则称战略$s_i’$为参与人$i$的劣战略(严格劣战略),或者说战略$s_i’’$相对$s_i’$占优。
弱劣战略
在$n$人博弈中,如果对于参与人$i$,存在战略$s’i,s’’_i \in S_i$,对$\forall s{-i}\in\prod \limits_{j=1,j \neq i}^n S_j$有:
且$\exists s’{-i}\in\prod \limits{j=1,j \neq i}^n S_j$,使得:
则称战略$s_i’$为参与人$i$的弱劣战略,或者说战略$s_i’’$相对$s_i’$弱占优。
为了表述方便,将弱劣战略和严格劣战略统称为劣战略。
在重复剔除劣战略求解博弈问题的过程中,如果每次可以提出的劣战略(包含弱劣战略和严格劣战略)不止一个,那么各个劣战略剔除的顺序不同可能会影响最终得到的博弈结果,除非每次剔除的都是严格劣战略。
如下图所示情形:
| b1 | b2 | b3 | |
|---|---|---|---|
| a1 | 3,3 | 3,1 | 1,2 |
| a2 | 1,1 | 2,0 | 2,0 |
| a3 | 3,4 | 1,3 | 3,2 |
重复剔除劣战略的方法
画横线,就看左边的值
画竖线,就看右边的值



