《博弈论基础》阅读笔记（一）

博弈的分类根据不同的基准也有不同的分类。

一般认为，博弈主要可以分为合作博弈和非合作博弈。合作博弈和非合作博弈的区别在于相互发生作用的当事人之间有没有一个具有约束力的协议，如果有，就是合作博弈，如果没有，就是非合作博弈。

从行为的时间序列性，博弈论进一步分为静态博弈、动态博弈两类：静态博弈是指在博弈中，参与人同时选择或虽非同时选择但后行动者并不知道先行动者采取了什么具体行动；动态博弈是指在博弈中，参与人的行动有先后顺序，且后行动者能够观察到先行动者所选择的行动。通俗的理解："囚徒困境"就是同时决策的，属于静态博弈；而棋牌类游戏等决策或行动有先后次序的，属于动态博弈

按照参与人对其他参与人的了解程度分为完全信息博弈和不完全信息博弈。完全博弈是指在博弈过程中，每一位参与人对其他参与人的特征、策略空间及收益函数有准确的信息。不完全信息博弈是指如果参与人对其他参与人的特征、策略空间及收益函数信息了解的不够准确、或者不是对所有参与人的特征、策略空间及收益函数都有准确的信息，在这种情况下进行的博弈就是不完全信息博弈。

经济学家们所谈的博弈论一般是指非合作博弈，由于合作博弈论比非合作博弈论复杂，在理论上的成熟度远远不如非合作博弈论。非合作博弈又分为：完全信息静态博弈，完全信息动态博弈，不完全信息静态博弈，不完全信息动态博弈。与上述四种博弈相对应的均衡概念为：纳什均衡(Nash equilibrium），子博弈精炼纳什均衡（subgame perfect Nash equilibrium），贝叶斯纳什均衡(Bayesian Nash equilibrium），精炼贝叶斯均衡(perfect Bayesian equilibrium)。

博弈论还有很多分类，比如：以博弈进行的次数或者持续长短可以分为有限博弈和无限博弈；以表现形式也可以分为一般型（战略型）或者展开型；以博弈的逻辑基础不同又可以分为传统博弈和演化博弈。

一、完全信息静态博弈

1、求解纳什均衡的方法：（1）重复剔除严格劣战略；（2）定义法（满足纳什均衡定义）；（3）划线法；（4）双方最优反应函数交点

2、纳什均衡的不唯一性、纳什均衡的存在性定理

3、混合战略纳什均衡，纯战略是混合战略的一种情况。

4、纳什定理：在n个参与者的标准式博弈G={S1,S2,….,Sn;u1,u2,…un}中，如果n是有限，且对每个i，Si是有限的，则博弈存在至少一个纳什均衡，均衡可能包含混合战略。(混合战略纳什均衡总是存在的)

二、完全信息动态博弈

1、完全且完美的信息博弈；完全但不完美信息博弈：在博弈的某些阶段，要选择行动的参与人并不知道在这一步之前进行的整个过程。

2、1）子博弈（subgame）：由一个单结信息集X开始的与所有该决策结的后续结（包括终点结）组成的，前面整个博弈的进行过程在所有参与者中都是共同知识，能够自成一个博弈的原博弈的一部分。即给定“历史”，每一个行动选择开始至博弈结束构成了的一个博弈，称为原动态博弈的一个“子博弈”。子博弈可以作为一个独立的博弈进行分析，并且与原博弈具有相同的信息结构。

2）子博弈精炼解。针对纳什均衡的多重性，子博弈精炼剔除了基于不可置信的威胁或承诺之上的纳什均衡。

3）子博弈精炼纳什均衡：扩展式博弈的策略组合 S*=(S1*,…, Si*,…, Sn* )是一个子博弈精炼纳什均衡当且仅当：如果它是原博弈的纳什均衡；它在每一个子博弈上也都构成纳什均衡。或者说：如果动态博弈的一个策略组合不仅在均衡路径上是纳什均衡，而且在非均衡路径上也是纳什均衡，就是该动态博弈的一个子博弈精炼纳什均衡。

3、完全且完美信息动态博弈的特点：1）行动是顺序发生的；2）下一步行动选择之前，所有以前的行动都可以被观察到；3）每一可能的行动组合下参与者的收益都是共同知识。

4、逆向归纳解不含有不可置信的威胁，在有限博弈中用逆向归纳法求出的逆向归纳解，必为子博弈精炼解；博弈的扩展式表述：博弈树。

5、多个博弈阶段的标准式表示。完全非完美信息两阶段博弈（及其变种）：

1）参与者1和2同时从各自的可行集A1和A2中选择行动a1和a2；

2）参与者3和4观察到第一阶段的结果（a1，a2），然后同时从各自的可行集A3和A4中选择行动a3和a4；

3）收益为ui（a1,a2,a3,a4）,i=1,2,3,4。

6、重复博弈定义及定理：令G={A1,…,An;u1,…,un}表示一个完全信息博弈，其中参与者1到n同时从各自的行动空间A1到An中分别选择行动a1到an得到的收益分别为u1（a1,…,an）,…,un(a1,…,an),称博弈G为重复博弈中的阶段博弈。

定义：对给定的博弈阶段G，令G(T)表示G重复进行T次的有限重复博弈，并在下一次博弈开始前，所有以前博弈的进行都可被观测到。G(T)的收益为T次阶段博弈收益的简单相加。

定理：如果阶段博弈G有唯一的纳什均衡，则对任意有限的T，重复博弈G(T)有唯一的子博弈精炼解：即G的纳什均衡结果在每一阶段重复进行。（该结论对于阶段博弈G为完全信息动态博弈或两阶段囚徒博弈时同样成立）

7、在有限重复博弈中，如果阶段博弈G有多个纳什均衡，重复博弈G(T)就可能会存在子博弈精炼解，其中对任意t<T，阶段t的结果都不是G的纳什均衡；在无限重复博弈中一个更强的结论成立：即使阶段博弈有唯一的纳什均衡，无限重复博弈中也可以存在子博弈精炼解，其中没有一个阶段的结果是G的纳什均衡。

8、无限重复博弈：给定一个阶段博弈G，令G(∞,∂)表示相应的无限重复博弈，其中G将无限次地重复进行，且参与者的贴现因子都为∂。对每一个t，之前t-1次阶段博弈的结果在t阶段开始进行前都可被观测到，每个参与者在G(∞,∂)中的收益都是该参与者在无限次的阶段博弈中所得收益的现值。

9、在有限重复博弈G(T)或无限重复博弈G(∞,∂)中，博弈到阶段t的进行过程(history of play through state t)指各方参与者从阶段1到阶段t所有行动的记录。

10、在有限重复博弈G(T)或无限重复博弈G(∞,∂)中，参与者的一个战略特指在每一阶段，针对其前面阶段所有可能的进行过程，参与者将会选择的行动。

11、在有限重复博弈G(T)中，由第t+1阶段开始的一个子博弈为G进行了T-t次后的重复博弈，可表示为G(T-t)。在无限重复博弈G(∞,∂)中，由第t+1阶段开始的每个子博弈都等同于初始博弈G(∞,∂)。和在有限情况下相似，博弈G(∞,∂)到t阶段为止有多少不同的可能进行过程，就有多少从t+1阶段开始的子博弈。

12、弗里德曼定理：令G为一个有限的完全信息静态博弈，令(e1,…,en)表示G的一个纳什均衡下的收益，且(x1,…,xn)表示G的其他任何可行收益。如果对每一个参与者i有xi>ei，且如果贴现因子∂足够接近于1，则无限重复博弈G(∞,∂)存在一个子博弈精炼纳什均衡，其平均收益可到达(x1,…,xn)。

13、完全非完美信息动态博弈。

14、定义：一个博弈的拓展式表述包括：（1）博弈中的参与人；（2a）每一参与者在何时行动；（2b）每次轮到某一参与者行动时，可供他选择的行动；（2c）每次轮到某一参与者行动时，他所了解的信息；（3）参与者可能选择的每一行动组合相对应的各个参与者的收益。

15、用博弈的标准式表示动态博弈；用博弈的拓展式表示静态博弈。定义：参与者的一个信息集(information set)指满足以下条件的决策节(decision node)的集合：

1）在此信息集中的每一个节都轮到该参与者行动，且

2）当博弈的进行达到信息集中的一个结，应该行动的参与者并不知道达到了（或没有达到）信息集中的哪一个节。

16、对完美信息的一个等价的定义是每一个信息集都是单节的；相反，非完美信息则意味至少存在一个非单节的信息集。

17、拓展式博弈中的子博弈定义：

1）始于单节信息集的决策节n。（但不包括博弈的第一个决策节）

2）包含博弈树中n之下所有的决策节和终点节。

3）没有对任何信息集形成分割。即如果博弈树中n之下有一个决策节n’,则和n’处于同一信息集的其他决策节也必须在n之下，从而也必须包含于子博弈中。

18、任何有限的完全信息动态博弈（即任何参与者有限、每一参与者的可行战略集有限的博弈）都存在子博弈精炼纳什均衡，也许包含混合战略。

19、“均衡”与“解”的区别：一个均衡是战略的集合（战略又是关于行动的完全的计划），而一个解则只对期望将要发生的特定情况给出相应的行动及结果，而不是针对所有可能发生的情况。在一个定义的完全且完美信息两阶段博弈中，逆向归纳解为(a1*,R2(a1*)),而子博弈精炼纳什均衡为(a1*,R2(a1)),其中R2(a1*)只是一个行动，具体来说是对a1*的最优反应，而R2(a1)是一个最优反应函数，它是一个战略。

《博弈论基础》阅读笔记（一）相关推荐

MOOC-浙江大学-博弈论基础-学习笔记（一）
MOOC-浙江大学-博弈论基础-学习笔记(一) 老师:蒋文华知人者智,自知者明: 胜人者力,自胜者强: 小胜者术,大胜者德. 第一讲概论 1.何为博弈? 博-博览全局, 奕-对弈棋局, 谋定而动! ...
MOOC-浙江大学-博弈论基础-学习笔记（三）
第二讲基本假设 from:蒋文华基本假设是博弈论的理论基础第一节理性假设一.认知理性 1.人是自我利益的判断者清楚的知道想要什么,更想要什么. 具有偏好的完备性, 具有偏好的传递性, 中庸 ...
MOOC-浙江大学-博弈论基础-学习笔记（八）
第五讲懦夫博弈和性别战(下) 对应书中第十章懦夫博弈.第十一章性别战争目录第一节性别战的基本模型第二节实例分析第三节扩展分析第四节均衡的存在性和多重性第一节性别战的基本模型 ...
MOOC-浙江大学-博弈论基础-学习笔记（七）
第五讲懦夫博弈和性别战(上) 对应书中第十章懦夫博弈.第十一章性别战争目录第一节懦夫博弈的基本模型第二节鹰鸽博弈第三节实例分析第四节公共物品的提供第五节来自懦夫博弈的特别提 ...
MOOC-浙江大学-博弈论基础-学习笔记（五）
第四讲万元陷阱和智猪博弈(上) 对应书中的第八章万元陷阱,第九章智猪博弈一.万元陷阱现象游戏: 现将10000元拍卖给大家,各位互相竞价,以100元为加价单位,直到没有人再加价为止.出价最高 ...
MOOC-浙江大学-博弈论基础-学习笔记（九）
第六讲混合策略与监督博弈对应书中的第十三章混合策略.第十四章监督博弈目录第一节概念及说明(混合策略) 第二节扩展分析 (混合策略) 第三节雇主与雇员的监督博弈第一节概念及说明(混 ...
Peer pressure in extortion game can resolve social dilemma（博弈论+机制设计）论文阅读笔记
Peer pressure in extortion game can resolve social dilemma 论文阅读笔记一.基本信息二.文章摘要三.核心模型四.分析过程五.论文总结 ...
Designing an optimal contest（博弈论+机制设计）论文阅读笔记
Designing an optimal contest 论文阅读笔记一.基本信息二.文章摘要三.背景介绍四.核心模型五.核心结论六.总结展望一.基本信息题目:设计一个最优竞赛作者: ...
Wisdom of the Crowd Voting：Truthful Aggregation of Voter Information and Preference（博弈论+机制设计）论文阅读笔记
Wisdom of the Crowd Voting:Truthful Aggregation of Voter Information and Preferences 论文阅读笔记一.基本信息二 ...
《通信统一架构OPC UA实践》 - 阅读笔记 1 工业4.0基础与OPC UA的实践
系列目录 - 阅读笔记 2 OPC UA信息模型及建模目录系列目录第一章 OPC UA--工业4.0基础 1.1.通信协议 1.2.导入OPA UA的步骤 1.3. 趋势和展望第二章 OPC ...

《博弈论基础》阅读笔记（一）

《博弈论基础》阅读笔记（一）相关推荐

最新文章

热门文章