Game Theory-Extensive form game
扩展式博弈
扩展式博弈包含以下要素:
- 参与人集合 $\Gamma={1,2,\cdots,n}$;
- 参与人的行动顺序,即每个参与人何时行动;
- 每个参与人行动时面临的决策问题,包括参与人行动时可供他选择的行动方案及他所了解的信息;
- 参与人的支付函数,即博弈结束时每个参与人得到的博弈结果。
博弈树及其表示
博弈树是由“结”和“有向枝”构成的“有向树”,最上方的节点是空心圆,表示博弈的开始,其余的节点用实心圆表示,结(node)分为:
初始结或根(root);
决策结(root);
终点结(terminal node)
信息集
在博弈树中,参与人 $i$ 的一个信息集(用 $I_i$ 表示)是参与人 $i$ 决策结的一个集合,且满足下列两个条件:
(1) $I_i$ 中的每个决策树都是参与人 $i$ 的决策结;
(2) 当博弈达到信息集 $I_i$ (即博弈到达 $I_i$ 中的某个决策结点)时,参与人 $i$ 知道自己位于信息集 $I_i$ 的节点上,但是不知道自己位于 $I_i$ 中的哪个节点上。
在决策树上,我们将位于同一个信息集上的节点用虚线连接起来。
假设
博弈的结构和参与人完全理性是共同知识
“完美记忆”假设
即假设参与人不会忘记以前知道或者做过的事情。
扩展式博弈的战略及其Nash均衡
用 $Hi$ 表示参与人 $i$ 的信息集 $I_i$ 的集合,即 $H_i={I_i}$ ;用 $A_i(I_i)$ 表示参与人 $i$ 在信息集上的行动集,$A_i(H_i)$ 表示参与人 $i$ 在所有信息集上的行动集,即 $A_i(H_i)=\bigcup\limits{I_i\in H_i} A_i(I_i)$ ,那么参与人 $i$ 的一个纯战略 $s_i$就是从信息集 $H_i$ 到行动集合 $A_i(H_i)$ 的一个映射关系,即:
其中,对于 $\forall I_i \in H_i,s_i(I_i)\in A_i(I_i)$
在以后的讨论中,用参与人 $i$ 在每个信息集 $I_i$ 上的行动集 $A_i(I_i)$ 笛卡尔积来表示参与人 $i$ 的战略集 $S_i$,即
对于扩展式博弈,博弈中可能发生的每一件事件序列,都可以用博弈树中的一条从初始结点(或者根)到终结点之一的由枝形成的路径表示,比如
扩展式博弈中,参与人的每一个战略组合与博弈树中的一条路径对应。
需要注意的是,每个战略组合都有唯一与之对应的路径,但是一个路径所对应的战略组合未必唯一。
扩展式博弈和战略式博弈的比较
扩展式博弈是动态模型,战略式博弈是静态模型。
由于Nash均衡只是一个静态的解的概念,所以扩展式博弈,需要先给出来博弈的战略式描述,才可能得到博弈的Nash均衡。
对于给定的扩展式博弈,总存在唯一的战略式博弈与之对应,但是对于给定的战略式博弈,会存在多个扩展式博弈与之对应。



