第6讲 完全信息动态博弈 ——逆向归纳法和子博弈完美均衡 完全且完美信息动态博弈 完全且完美信息动态博弈 参与人1从行动集A1选择行动a1 参与人2观察到a1,之后从行动集A2选择行动a2 两个人的收益分别为u1(a1,a2)和u2(a1,a2) 完全且完美信息动态博弈 均衡 策略 结果 E1 {大,(L/L,L/S)} 都选择大 E2 {大,(L/L,S/S)} 都选择大 E3 {小,(S/L,S/S)} 都选择小 完全且完美信息动态博弈 逆向归纳法 背后假设:参与人在每个节点都是理性的 当参与人2行动的时候,他已经看到了参与人1的行动,那么他的问题是: 如果隐函数定理成立,那么解为R2(a1) 完全且完美信息动态博弈 逆向归纳法 参与人1可以预测到参与人2对于其行动的反应,那么参与人1的问题是: 完全且完美信息动态博弈 逆向归纳法 我们称 (a*1,R(a*1))为逆向归纳均衡策略 逆向归纳解不包含不可置信的威胁:参与人1预测参与人2的最优反应,这一预测排除了参与人2不可置信的威胁,即参与人2在第二阶段到来时做出不符合自身利益的反应。 E2 {大,(L/L,S/S)} 完全且完美信息动态博弈 考虑如下博弈 完全且完美信息动态博弈 逆向归纳法的理性假定: 逆向归纳重点关注了偏离均衡会怎么样。不过只有偏离均衡才能有2选择的机会,而这时假设1是理性的就与1选择R矛盾了。此时似乎应该假设1非理性。 我们不需要这么理解,1选择R可能是理性不是共同知识。 逆向归纳法的理性假定: 一种可能是“参与人1是理性的”为共同知识,但是“参与人2是理性的”不是共同知识,参与人1希望参与人2非理性。 另一种可能是“参与人2是理性的”为共同知识,但是“参与人1是理性的”不是共同知识,参与人1希望参与人2认为他非理性。 这两个解释说明了逆向归纳法为什么可以假设1会在第一阶段选择R。 “颤抖的手”均衡 完全非完美信息动态博弈 逆向归纳法的主要特征是,当我们考虑博弈的子博弈,利用逆向归纳法计算的均衡仍然是子博弈的均衡。 子博弈完美将这个概念推广到一般的完全信息动态博弈 完全非完美信息动态博弈 纳什均衡是子博弈完美均衡,当且仅当它是这个博弈每个子博弈的纳什均衡。 那么什么是子博弈? 完全非完美信息动态博弈 扩展型博弈的子博弈: 始于单点信息集n 包含博弈树中n之下所有的决策结和终点结(不在n以下的除外) 没有对任何信息集形成分割。 例子 子博弈的均衡 给定这个结果 另一个纳什均衡 另一个例子 任何纳什均衡都是子博弈完美的 子博弈完美均衡的背后: 序贯理性:参与人需要在博弈的每一点最大化自己的支付,在每一点重新优化其决策,并考虑到自己在未来会重新进行优化。这就是忽略沉淀成本和理性预期 弱纳什均衡对于博弈微小变化不稳健。犯错误的概率称为“颤抖”。 这两个思路并不相同。考虑下面的例子: 三个纳什均衡: (in up) (out up) (out down) 这三个都是弱纳什均衡。 (in up) (out up)是子博弈完美均衡。 但是(in up)不是颤抖的手均衡。

Matlab逆向归纳法,6.完全信息动态博弈—逆向归纳法和子博弈完美均衡.ppt相关推荐

  1. [系统安全] 二十三.逆向分析之OllyDbg动态调试复习及TraceMe案例分析

    您可能之前看到过我写的类似文章,为什么还要重复撰写呢?只是想更好地帮助初学者了解病毒逆向分析和系统安全,更加成体系且不破坏之前的系列.因此,我重新开设了这个专栏,准备系统整理和深入学习系统安全.逆向分 ...

  2. 首都师范 博弈论 6 1 7逆向归纳法应用2 斯塔克伯格模型

    6 1 7逆向归纳法应用2 斯塔克伯格模型

  3. 逆向路由器固件之动态调试

    原文地址:http://xdxd.love/2016/09/20/逆向路由器固件之动态调试/ 本文根据devttyS0的教程Exploiting Embedded Systems – Part 2和E ...

  4. Android 逆向笔记 —— 一个简单 CrackMe 的逆向总结

    温馨提示 请拖动到文章末尾,长按识别「抽奖」小程序. 在我的印象中,懂逆向的,都是大牛,让我们一起来看看下面这位大牛的学习心得. 无意中在看雪看到一个简单的 CrackMe 应用,正好就着这个例子总结 ...

  5. 逆向开发技术栈通_逆向方向

    岗位要求: 1.熟悉HTTP.TCP等网络协议及数据抓包.分析: 2.熟悉Android程序apk以及so的逆向分析流程:擅长安卓逆向,熟悉静态与动态的分析方法: 3.精通C/C++.JAVA编程,精 ...

  6. 【转】MATLAB如何制作动画(动态图形演示movie)

    https://jingyan.baidu.com/article/49711c6199002dfa451b7c52.html MATLAB如何制作动画(动态图形演示movie) 听语音 | 浏览:7 ...

  7. matlab作动态函数曲线图,[转载]Matlab中使用Plot函数动态画图方法总结

    本帖最后由 sonictl 于 2012-12-31 12:18 编辑 请删除我 清楚超靠靠靠 没办法,一会儿限制这不能发表,那不能发表的.... [转载]Matlab中使用Plot函数动态画图方法总 ...

  8. matlab中s_cplot,matlab系统模型建立和动态特性研究分析实验.docx

    实验二MATLAB系统模型建立和动态特性分析实验 一.实验目地 1掌握如何使用 MALAB进行系统模型地建立: 2 ?学习利用MALAB命令得阶跃响应曲线,分析系统动态特性; 3.利用MALAB求阶跃 ...

  9. Python爬虫从入门到精通:(41)JS逆向_RSA加密,Steam加密逆向_Python涛哥

    RSA加密: RSA加密算法是一种非对称加密算法.在公开密钥加密和电子商业中RSA被广泛使用. 非对称加密算法: 非对称加密算法需要两个密钥: 公开密钥(publickey:简称公钥) 私有密钥(pr ...

最新文章

  1. oschina添加ssh公钥一记
  2. MAC OS X 1.1 El Capitan安装方法与步骤
  3. sharepoint当流程流转到某个节点对文档进行水印操作
  4. DSB2017第一名论文理解: 3D Deep Leaky Noisy-or Network(二)
  5. 计算机控制pud,控制系统状态空间实施方案计算机控制技术课程实施方案
  6. 顶级前端工程师需要具备的经验和最佳实践(这才是市场急需的前端):
  7. 进程与线程之间的区别与联系
  8. 回文数 详解(C++)
  9. 几款对于学习前端比较好用的软件或网址
  10. 平面向量加法 (15 分)
  11. C++信号量实现线程间同步,windows使用SetEvent,linux使用sem_t,QT测试
  12. day2和day3随堂笔记
  13. neo4j图形数据库Java应用
  14. Apple quietly slips WebRTC audio, video into Safari's WebKit spec
  15. 运营商大数据的发展现状和趋势
  16. 蜜罐天堂Honeydrive的部署和Dionaea的试运行
  17. dodo:人脸识别方法个人见解zz
  18. mac 天文软件安装配置【python/ds9/iraf】
  19. 新一代BOSS系统解决方案
  20. 清华大学开源了一项神器,在 GitHub 爆了!

热门文章

  1. 退出登录清空session
  2. 静态背景下运动目标检测
  3. Linux-常用快捷键
  4. html5加载更多,HTML5[7]: 实现网页版的加载更多
  5. idea+springmvc+spring+mybatis+maven整合返回json数据web api-
  6. c语言 乘法运算符,C 乘法运算符
  7. Python英文单词大小写转换及所有首字母大写
  8. 计算机专业120分,【哈尔滨工业大学,专业课120分】跟你唠点真情实感。
  9. 【收藏夹2020-2021】
  10. Rooting Android