扩展式博弈

扩展式博弈包含以下要素:

  1. 参与人集合 $\Gamma={1,2,\cdots,n}$;
  2. 参与人的行动顺序,即每个参与人何时行动;
  3. 每个参与人行动时面临的决策问题,包括参与人行动时可供他选择的行动方案及他所了解的信息;
  4. 参与人的支付函数,即博弈结束时每个参与人得到的博弈结果。

博弈树及其表示

博弈树是由“结”和“有向枝”构成的“有向树”,最上方的节点是空心圆,表示博弈的开始,其余的节点用实心圆表示,结(node)分为:

  • 初始结或根(root);

  • 决策结(root);

  • 终点结(terminal node)

信息集

在博弈树中,参与人 $i$ 的一个信息集(用 $I_i$ 表示)是参与人 $i$ 决策结的一个集合,且满足下列两个条件:

  • (1) $I_i$ 中的每个决策树都是参与人 $i$ 的决策结;

  • (2) 当博弈达到信息集 $I_i$ (即博弈到达 $I_i$ 中的某个决策结点)时,参与人 $i$ 知道自己位于信息集 $I_i$ 的节点上,但是不知道自己位于 $I_i$ 中的哪个节点上。

在决策树上,我们将位于同一个信息集上的节点用虚线连接起来。

假设

博弈的结构和参与人完全理性是共同知识

“完美记忆”假设

即假设参与人不会忘记以前知道或者做过的事情。

扩展式博弈的战略及其Nash均衡

用 $Hi$ 表示参与人 $i$ 的信息集 $I_i$ 的集合,即 $H_i={I_i}$ ;用 $A_i(I_i)$ 表示参与人 $i$ 在信息集上的行动集,$A_i(H_i)$ 表示参与人 $i$ 在所有信息集上的行动集,即 $A_i(H_i)=\bigcup\limits{I_i\in H_i} A_i(I_i)$ ,那么参与人 $i$ 的一个纯战略 $s_i$就是从信息集 $H_i$ 到行动集合 $A_i(H_i)$ 的一个映射关系,即:

其中,对于 $\forall I_i \in H_i,s_i(I_i)\in A_i(I_i)$

在以后的讨论中,用参与人 $i$ 在每个信息集 $I_i$ 上的行动集 $A_i(I_i)$ 笛卡尔积来表示参与人 $i$ 的战略集 $S_i$,即

对于扩展式博弈,博弈中可能发生的每一件事件序列,都可以用博弈树中的一条从初始结点(或者根)到终结点之一的由枝形成的路径表示,比如

扩展式博弈中,参与人的每一个战略组合与博弈树中的一条路径对应。

需要注意的是,每个战略组合都有唯一与之对应的路径,但是一个路径所对应的战略组合未必唯一。

扩展式博弈和战略式博弈的比较

扩展式博弈是动态模型,战略式博弈是静态模型。

由于Nash均衡只是一个静态的解的概念,所以扩展式博弈,需要先给出来博弈的战略式描述,才可能得到博弈的Nash均衡。

对于给定的扩展式博弈,总存在唯一的战略式博弈与之对应,但是对于给定的战略式博弈,会存在多个扩展式博弈与之对应。