动态博弈(dynamic game)是指参与人的行动有先后顺序,而且行动在后者可以观察到行动在先者的选择,并据此作出相应的选择。

动态博弈的困难在于,在前一刻最优的决策在下一刻可能不再为最优,因此在求解上发生很大的困难。

动态博弈行动有先后顺序,不同的参与人在不同时点行动,先行动者的选择影响后行动者的选择空间,后行动者可以观察到先行动者做了什么选择,因此,为了做最优的行动选择,每个参与人都必须这样思考问题:如果我如此选择,对方将如何应对?如果我是他,我将会如何行动?给定他的应对,什么是我的最优选择?如下棋。

在动态博弈中,行动总有先后顺序。有些博弈具有先动优势(first-mover advantage),但有些博弈具有后动优势(second-mover advantage)。产量竞争具有先动优势,而价格竞争可能是后动优势;但有些博弈既没有先动优势,也没有后动优势,如抓阄。

在不完全信息下,顺序更重要。

完全信息静态博弈只是一种独特的理想状态。在现实中,当后一个参与人行动时,自然会根据前者的选择而调整自己的选择,而前者也会理性地预期到这一点,所以不可能不考虑自己的选择对他人的影响。1965年,泽尔腾通过对动态博弈的分析,提出了“子博弈精炼纳什均衡”的概念,它要求任何参与人在任何时间、地点的决策都是最优的,决策者应该随机应变,而不是固守前谋。这就推导出子博弈的概念。当参与人的战略在每一个子博弈中都构成纳什均衡时,则形成“子博弈精炼纳什均衡”。也就是说,组成“子博弈精炼纳什均衡”的战略必须在每一个子博弈中都是最优的。

子博弈精炼纳什均衡的创立者。 ——1994年诺贝尔经济学奖获奖者、莱茵哈德·泽尔腾(Reinhard Selten).

泽尔腾则在60年代中期将纳什均衡概念引入动态分析。提出了“子博弈精炼纳什均衡”的概念,又称“子对策完美纳什均衡”。这一研究对纳什均衡进行了第一次改进,选择了更具说服力的均衡点。海萨尼在60年代末把不完全信息引入博弈分析。

将纳什均衡中包含的不可置信的威胁策略剔除出去。它要求参与者的决策在任何时间点上都是最优的,决策者要“随机应变”,“向前看”,而不是固守旧略。

由于剔除了不可置信的威胁,在许多情况下,精炼纳什均衡也就缩小了纳什均衡的个数。这一点对预测分析是非常有意义的。

用动态博弈理论来讨论实际究竟发生哪个纳什均衡。

给定“历史”,每一个行动选择开始至博弈结束构成了一个博弈,称为“子博弈”。

只有当参与人的策略在每一个子博弈中都构成纳什均衡叫做精炼纳什均衡。或者说,组成精炼纳什均衡的策略必须在每一个子博弈中都是最优的。

博弈论专家常常使用“序贯理性”(Sequential rationality):指不论过去发生了什么,参与人应该在博弈的每个时点上最优化自己的策略。子博弈精练纳什均衡所要求的正是参与人应该是序惯理性的。对于有限完美信息博弈,逆向归纳法是求解子博弈精炼纳什均衡的最简便的方法。

不可置信的威胁是博弈论里的一个概念,在动态博弈求出的纳什均衡有的均衡其实是不可能达到的,因为如果参与者都是理性的,如果参与者1为了使得参与者2的收益减小,从而选择了某个策略,比如策略a,但如果他选择b的话他的收益会大于选择a的收益,选择a就是一个不可置信的威胁,这时不能用纳什均衡概念求解了,要用子博弈凝练均衡的概念。

子博弈精炼纳什均衡用于区分动态博弈中的"合理纳什均衡"与"不合理纳什均衡",将纳什均衡中包含有不可置信威胁策略的均衡剔除出去,就是说,使最后的均衡中不再包含有不可置信威胁策略的存在。

逆向归纳法(Backward Induction)是求解子博弈精炼纳什均衡的最简便方法。在求解子博弈精炼纳什均衡时,从最后一个子博弈开始逆推上去,这就是逆向归纳法。所以逆向归纳法就是从动态博弈的最后一个阶段或最后一个子博弈开始,逐步向前倒推以求解动态博弈均衡的方法。

逆向归纳法:它的精髓就是“向前展望,向后推理”,即首先仔细思考自己的决策可能引起的所有后续反应,以及后续反应的后续反应,直至博弈结束;然后从最后一步开始,逐步倒推,以此找出自己在每一步的最优选择。

动态博弈--gyy参考总结相关推荐

  1. 贝叶斯法则求垄断者阻挠概率的动态博弈问题

    贝叶斯法则举例分析 引用贝叶斯法则的举例分析 第1步 计算P(B): 挑战者B不知道原垄断者A是属于高阻挠成本类型还是低阻挠成本类型,但B知道,如果A属于高阻挠成本类型,B进入市场时A进行阻挠的概率是 ...

  2. 三方博弈matlab_小星星的读研日记之电商动态博弈知多少?

    点击蓝字关注我们 大家好 大家好,我是小帅学长,20年成功上岸厦门大学物流工程与管理专业.我毕业于西南交通大学 物流工程专业. 在大学期间,为了提升对专业知识的运用,参加了不少竞赛和项目,例如srtp ...

  3. Matlab逆向归纳法,6.完全信息动态博弈—逆向归纳法和子博弈完美均衡.ppt

    第6讲 完全信息动态博弈 --逆向归纳法和子博弈完美均衡 完全且完美信息动态博弈 完全且完美信息动态博弈 参与人1从行动集A1选择行动a1 参与人2观察到a1,之后从行动集A2选择行动a2 两个人的收 ...

  4. 读书笔记: 博弈论导论 - 16 - 不完整信息的动态博弈 信号传递博弈

    读书笔记: 博弈论导论 - 16 - 不完整信息的动态博弈 信号传递博弈 信号传递博弈(Signaling Games) 本文是Game Theory An Introduction (by Stev ...

  5. 动态博弈、威胁与承诺(博弈论入门学习笔记四)

    0 动态博弈 动态博弈:行动有先后顺序,不同的参与人在不同时点行动,先行动者的选择影响后行动者的选择空间,后行动者可以观察到先行动者做了什么选择.例如下棋.消费者和商家讨价还价.谈婚论嫁.企业之间的价 ...

  6. 首都师范 博弈论 6 1 动态博弈简介

    6 1 动态博弈简介

  7. 读书笔记: 博弈论导论 - 08 - 完整信息的动态博弈 可信性和序贯理性

    读书笔记: 博弈论导论 - 08 - 完整信息的动态博弈 可信性和序贯理性 可信性和序贯理性(Credibility and Sequential Rationality) 本文是Game Theor ...

  8. 博弈论之:动态博弈,先下手为强

    <博弈论究竟是什么.万维钢>读后小记:这是一本小册子,主要讲一些入门知识,没有算法和数学公式,闲来读一读蛮惬意的. A.动态博弈 "动态博弈"是指参与者出手有先后次序, ...

  9. 博弈论(2)例题:混合策略+完全信息动态博弈+可置信性与序贯理性 (研究生院的竞争/否决权/技术应用) Steven Tadelis - Game Theory. An Introduction

    这些都是之前上课的作业,就是做个整理(我按照作业分章节的),也希望能帮助大家学习叭~ 作业会附上部分中文题目和英文(就是检索内容,具体的题目全部贴图,打公式真的太难了555),有些公式可能有点问题,我 ...

  10. flowable 实现多实例-会签-动态配置人员 参考demo

    会签 即多人执行当前任务 设置判断数 通过 例如:设置了是半数通过即可通过当前节点 如果当前是4人那就是2人即通过 如果是6人那就是三人即通过 如果是5人 即三人通过 看各位的判断值是如何书写 这个值 ...

最新文章

  1. 手机WebAPP设计注意事项和解决方法
  2. silverlight控件打印预览
  3. gz键盘增强小工具_这些不起眼的Mac小工具,能让你的Macbook效率倍增!
  4. Ubuntu下安装为知笔记Linux版本
  5. 我们来谈下高并发和分布式中的幂等处理
  6. java 开源 网络流量统计_jpcap java流量监控
  7. leetcode896. 单调数列
  8. Java应用性能调优工具介绍及实践
  9. 《Servlet和JSP学习指南》一导读
  10. 一个实用的String实现类(C++)
  11. linux上设置tomcat下web项目只需要ip地址访问省略端口和项目名称
  12. 深入浅出设计模式(C#/Java版)
  13. 抖音矩阵系统,抖音矩阵系统源码,抖音SEO源码。
  14. KL散度、JS散度 的理解以及一些问题
  15. cors js解决js跨域问题
  16. tomcat之servlet容器
  17. Css3中align-content,css align-content属性怎么用
  18. 微积分小糊涂,国庆节大快乐!
  19. 基于java的简单的(即时通讯)聊天程序
  20. 如何生成git的公钥和私钥

热门文章

  1. es管理器免root_真正免root的ES文件浏览器详细使用教程
  2. word生成电子签名
  3. 图解python中的time、datetime模块及他们的时间格式转换(附:格林尼治时间gmt、本地时间、协调世界时utc)
  4. 孙思邈的养生哲学和孔子的阴阳和谐之道
  5. Bumped! 2017 ICPC North American Qualifier Contest (分层建图+dijstra)
  6. 服务器机柜可放多大显示器,一个标准服务器机柜究竟能够放多少服务器
  7. 仿蓝色理想的“运行代码”功能
  8. OpenSSL-SNI
  9. EverEdit 4.2.0.4457 免安装已激活 x64
  10. [C#]C# 如何捕获键盘按钮和组合键以及KeyPress/KeyDown事件之间的区别 (附KeyChar/KeyCode值)