博弈论笔记:动态博弈
1 导言
静态博弈:所有参与人同时行动
动态博弈:参与人行动有先后顺序,后行动者在先行动者做出决策之后在做出决定(eg,下棋
常用博弈树表示动态博弈
2 动态博弈
动态博弈中,事前最优的战略可能不是事后最优。(A可以按照B声明的来判断选择,也可以不按照;那么B就可以因地制宜地改变。——相机行动方案,contingent action plan)
以上图为例,老师的决策是给学生打分打及格or不及格;学生事先声明,如果我及格了,我是选择A(accept)战略还是F(fighting)战略。(这个声明老师也是能看得到的)
对于上面这个表达式,我们有三个纳什均衡一个是【及格,(A,F)】,一个是【不及格,(F,A)】,另一个是【不及格,(A,A)】。
我们先看第一个纳什均衡。学生申明我采取的是(A,F)战略,老师为了不得到-10的代价,会选择给学生及格。但是退一步讲,即便老师给了不及格,学生也不会选择F战略,因为此时学生选了F战略的话,虽然老师是-10的代价了,可自己也是-10的代价,损失太大。因此,如果学生是理性的,那么即使老师给了不及格,学生也不会选择F战略。那么老师就不会受其威胁。因此,(A,F)是一个不可置信威胁。
我们再看第二个纳什均衡。学生申明我采取的是(F,A)战略,老师为了不得到-10的代价,选择了给学生不及格。但退一步讲,即使老师给了及格,学生也不会选择F战略(和(A,F)战略不可置信是一样的推导方式),因此(F,A)也不是一个可置信威胁。
最后一个纳什均衡,分析下来是可以达到的,(A,A)是一个可置信威胁。
——》动态均衡就是要排除一些不可置信的威胁。
2.1 精炼纳什均衡 perfect NE
2.2 子博弈
2.3 逆向归纳法 backward induction
2.4 理性共识
3 承诺
3.1 承诺举例
3.1.1 婚姻
3.1.2 公债
D表示最大公债,r表示公债的利率,P表示政府违约的时候受到的惩罚
——>政府履约的条件:D(1+r)<=P(即违约收到的惩罚大于我吞掉公债的获得)
也就是说,政府可发行的最大公债为P/(1+r)
老百姓对政府的约束能力决定了P
——>有限(民主)政府比专制政府可以发行的公债更多
3.1.3 非升即走的大学制度
老制度下,精炼纳什均衡是不努力,不提升。
新制度下,精炼纳什均衡是努力,提升。
博弈论笔记:动态博弈相关推荐
- 读书笔记: 博弈论导论 - 16 - 不完整信息的动态博弈 信号传递博弈
读书笔记: 博弈论导论 - 16 - 不完整信息的动态博弈 信号传递博弈 信号传递博弈(Signaling Games) 本文是Game Theory An Introduction (by Stev ...
- 动态博弈、威胁与承诺(博弈论入门学习笔记四)
0 动态博弈 动态博弈:行动有先后顺序,不同的参与人在不同时点行动,先行动者的选择影响后行动者的选择空间,后行动者可以观察到先行动者做了什么选择.例如下棋.消费者和商家讨价还价.谈婚论嫁.企业之间的价 ...
- 读书笔记: 博弈论导论 - 08 - 完整信息的动态博弈 可信性和序贯理性
读书笔记: 博弈论导论 - 08 - 完整信息的动态博弈 可信性和序贯理性 可信性和序贯理性(Credibility and Sequential Rationality) 本文是Game Theor ...
- 博弈论之:动态博弈,先下手为强
<博弈论究竟是什么.万维钢>读后小记:这是一本小册子,主要讲一些入门知识,没有算法和数学公式,闲来读一读蛮惬意的. A.动态博弈 "动态博弈"是指参与者出手有先后次序, ...
- 首都师范 博弈论 6 1 动态博弈简介
6 1 动态博弈简介
- 三方博弈matlab_小星星的读研日记之电商动态博弈知多少?
点击蓝字关注我们 大家好 大家好,我是小帅学长,20年成功上岸厦门大学物流工程与管理专业.我毕业于西南交通大学 物流工程专业. 在大学期间,为了提升对专业知识的运用,参加了不少竞赛和项目,例如srtp ...
- 文件和存储管理学习笔记-动态磁盘管理
Server 2008 R2 文件和存储管理学习笔记-动态磁盘管理 基本磁盘是包含基本分区.扩展分区或逻辑驱动器的一种物理磁盘 动态磁盘提供了基本磁盘不提供的一些高级功能,创建无限数量卷.跨越多个磁盘 ...
- 贝叶斯法则求垄断者阻挠概率的动态博弈问题
贝叶斯法则举例分析 引用贝叶斯法则的举例分析 第1步 计算P(B): 挑战者B不知道原垄断者A是属于高阻挠成本类型还是低阻挠成本类型,但B知道,如果A属于高阻挠成本类型,B进入市场时A进行阻挠的概率是 ...
- Matlab逆向归纳法,6.完全信息动态博弈—逆向归纳法和子博弈完美均衡.ppt
第6讲 完全信息动态博弈 --逆向归纳法和子博弈完美均衡 完全且完美信息动态博弈 完全且完美信息动态博弈 参与人1从行动集A1选择行动a1 参与人2观察到a1,之后从行动集A2选择行动a2 两个人的收 ...
- 博弈论——非合作博弈 什么是纳什均衡
博弈论--非合作博弈 纳什均衡用一句话来概括就是--博弈的所有参与人都为了满足自己 的个人利益而选择牺牲集体利益而导致的全体参与人都吃亏的均衡状态. 也可以粗略的理解为:要死大家一起死. 纳什均衡的本 ...
最新文章
- loadrunner,socket脚本总结
- python小项目推荐项目-推荐 10 个有趣的 Python 项目
- Java学习笔记之static
- c语言局部变量存在什么区_C语言程序设计变量运用指南 C语言局部变量的存储方式和生存期...
- 如何保证 Serverless 业务部署更新的一致性?
- JavaScript命名空间
- SDUT 3377 数据结构实验之查找五:平方之哈希表
- matlab 0-100随机数,添加到100的随机数:matlab
- IAR #pragma optimize 指令
- c语言经典程序技能高考,计算机类技能高考介绍
- 小区选择与重选的方法理解
- docker容器中使用vlc将视频文件推成rtsp流
- 计算机打字速度在线测试,在线测试打字速度(一分钟打字速度测试)
- Python游戏编程入门(有目录及案例图片)-通过简单游戏学习python
- mysql-8.0.31-winx64详细安装教程
- 转:浅析镜头分辨率和MTF测试
- 使用OGG/Kettle实现Oracle到MySQL数据平滑迁移
- 总帐追溯到各模块 R12
- Mac OS 输入adb命令无效(zsh: command not found: adb)的解决方法
- matlab 同步原理搜集
热门文章
- 微博签到打卡点数据集—北上广深杭
- raspberry pi 4检查ch340/ch341驱动
- 解决win10系统安装ch341驱动程序显示“预安装成功”的一个方法
- Golang + selenium 设置无头浏览器模式
- 深度学习(二),终于理解了深度学习原理--SPGD(SGD)优化算法的实现原理
- 基于SVP的格密码计算复杂性问题
- 华为手机怎样恢复Android,华为手机恢复出厂设置的教程和方法
- 想请问下PDF双面打印时(打印机自动双面打印)为什么反面那页的内容是倒过来的,应该怎么设置?...
- NORDIC nRF52840 输入引脚初始化及中断操作
- CUDA优化之PReLU性能调优