囚徒困境、智猪博弈、纳什均衡与一致预期(博弈论入门学习笔记二)
0 囚徒困境:
假定有两个犯罪嫌疑人共同作案。警察抓住他们以后,分开拘押,并告诉他们:可以选择坦白,或是不坦白;如果一个人坦白,而另一个人不坦白,则坦白的一方会被立即释放,而不坦白的一方被判10年;如果两人都坦白,则会每人各判8年;如果两人都抵赖,因证据不足,则每人在关押1年后释放。那么,这两个犯罪嫌疑人该如何选择呢?
现在我们来看参与人甲和乙会如何决策。我们假设参与人是理性的,都不想坐牢,能少坐牢尽量少坐牢。我们先考虑甲的选择,他面对的问题是:如果乙坦白的话,自己坦白判8年,不坦白判10年,那么坦白比不坦白好;如果乙不坦白,自己坦白会被立即释放,不坦白则判1年,坦白还是比不坦白好。因此,不论对方坦白不坦白,甲或乙自己的最优选择都是坦白。
占优均衡:一般来说,由于每个参与人的效用依赖于所有人的选择,因此每个人的最优选择(战略)也依赖于所有其他人的选择(战略)。但由囚徒困境我们可以看出,一个人的最优选择并不依赖于他人的选择。这样的最优战略,被称为“占优战略”。由所有参与人的占优战略构成的战略组合被称为“占优均衡”。
占优战略均衡的出现只要求所有人都是理性的,但不要求每个参与人知道其他人是否理性。
囚徒困境博弈有占优均衡,所以其结果很容易预测。
“囚徒困境”表明个人理性与集体理性的冲突。这样的例子有很多:寡头竞争,军备竞赛,团队生产中的劳动供给,公共产品的供给,等等。许多的制度就是为了解决“囚徒困境”而存在的。
私人产品是志愿购买的,但公共产品可能需要强制购买;税收制度就是保证公共产品的生产,解决公共产品生产上的“囚徒困境”。
囚徒困境的一般表示:
要使上述博弈成为一个囚徒困境需要满足这样一个条件:R>T>P>S。
解决囚徒困境的一种方式:用法律解决“囚徒困境”
满足:X>R-T
1 “智猪博弈”:
设想猪圈里有两头猪,一头大猪和一头小猪。在猪圈的一头装有一个按钮,另一头装有食槽。在这头按下按钮,那头的食槽会有8单位的实物出现;于是出现如下博弈:
有些博弈没有占优均衡,但通过剔除“坏”战略,我们可以预测博弈的结果。比如“智猪博弈”,在这个博弈中,大猪的最优选择依赖于小猪的选择,但小猪的最优选择与大猪的选择无关。如果大猪知道小猪是理性的,大猪将选择“按”。均衡是“大猪按,小猪等待”。
“劣”战略:无论对方选择什么,如果自己选择A得到的收益总是小于选择B得到的收益,A就是相对于B的劣战略。
重复剔除占优均衡:首先找出博弈参与人的劣战略(假定存在的话),把这个劣战略剔除后;然后再剔除剩下的新的博弈中的劣战略;继续这个过程,直到没有劣战略存在。如果剩下的战略组合是唯一的,这个唯一的战略组合就是“重复剔除占优均衡”。如果这样的解存在,我们说该博弈是“重复剔除占优可解的”。
2 理性共识:
0阶理性共识:每个人都是理性的,但不知道其他人是否是理性的;
1阶理性共识:每个人是理性的,并且知道其他每个人也都是理性的,但并不知道其他人是否知道自己是理性的;
2阶理性共识:每个人是理性的,并且知道其他每个人也都是理性的,并且知道其他人知道自己是理性的,但不知道其他人是否知道自己知道其他人都是理性的。。。。。。。三阶、四阶。。。n阶依次类推。
重复剔除不仅要求每个人是理性的,而且要求每个人知道其他人都是理性的,每个人知道每个人知道每个人是理性的,如此等等,即理性是“共识”。
很多博弈没有占优均衡,也没有重复剔除的占优均衡。考虑如下博弈:
相互一致性信念:要求每个参与人对别人的行为的预期都是正确的。
内在一致性信念:参与人有合理的理由认为别人会做出何种选择。
根据相互一致性预期,如果两个理性的人有相同的信息,那么他们就一定会得出相同的推断或相同的结论。(2005年诺贝尔经济学奖)。上述博弈有9个可能的战略组合,其中只有(R3,C3)满足一致预期(根据相互一致性信念,每个人对别人的行为的预期都是正确的)。
3 纳什均衡与一致预期:
纳什均衡:所有参与人的最优战略的组合:给定该战略中别人的选择,没有人有积极性改变自己的选择。
一致预期:基于信念的选择是合理的;支持选择的信念是正确的。
预期的自我实现:如果所有人都认为这个结果会出现,这个结果就会出现。预期是自我实现的,预期不会错误。
纳什均衡有一个很重要的特点,即信念和选择之间的一致性。就是说,基于信念的选择是合理的,同事支持这个选择的信念也是正确的。纳什均衡也可以说是可以自我实施的,也就是说,如果所有人都认为这个结果会出现,这个结果就真的会出现。
如果参与人事前达成一个协议,在不存在外部强制的情况下,每个人都有积极性遵守这个协议,这个协议就是纳什均衡。
寻找纳什均衡:(R2,C2)
考虑如下囚徒困境:
利用所有权解决囚徒困境:使其中一个人成为所有者,另一个人变成雇员,让前者监督后者。
4 混合策略下的纳什均衡:
考虑如下博弈:
这个博弈没有纳什均衡。现在我们引入另一个概念:混合战略纳什均衡,之前讲到的纳什均衡指的是纯战略纳什均衡,即确定地选择某一特定的战略,如果两个战略互为最优,就是一个(纯战略)纳什均衡。与纯战略相对应,混合战略是指,参与人以某一概率随机地选择某一行动。比如在划拳博弈中,每个参与者的最优选择一定是要随机地出招,从而使对方无法猜测到自己要出什么。
现在我们来看一个混合战略纳什均衡的应用例子——监督博弈。
在这个例子中,员工不偷懒、老板不监督是最好的(总收益最大),但这不是一个纳什均衡。如果员工不偷懒,则老板不监督;但如果员工知道老板不监督,员工则偷懒;如果老板知道员工偷懒,老板则监督。。。。形成一个循环。
假如老板认为员工偷懒的概率是P,不偷懒的概率是1-P,从老板的角度看,监督的预期收益是:
1×P+(-1)×(1-P)=2P-1。。。。(1)
如果不监督,预期收益为:
(-2)×P+2×(1-P)=1-4P。。。。(2)
另(1)=(2),得P=1/3,这时,员工选择以1/3的概率偷懒,2/3的概率不偷懒,老板监督与不监督是一样的。
假如老板以Q的概率选择监督,1-Q的概率选择不监督,这时,从员工的角度,选择偷懒的预期收益是:
(-1)×Q+3×(1-Q)=3-4Q。。。。(3)
选择不偷懒的预期收益为:
2×Q+2×(1-Q)=2。。。。(4)
要使员工的选择在这两者之间无差异,则另(3)=(4),得Q=1/4;意味着老板以1/4的概率监督,3/4的概率不监督。
因此,混合战略纳什均衡是:员工以1/3的概率偷懒,2/3的概率不偷懒;老板以1/4的概率监督,3/4的概率不监督。
纳什均衡的存在性问题:(一般存在奇数个纳什均衡)
1、每一个有限博弈至少存在一个纳什均衡(纯战略或混合战略);
2、如果一个博弈存在两个纯战略纳什均衡,那么,一定存在第三个混合战略纳什均衡。
5 高风险下的纳什均衡
在一些特殊情况下,即使犯错误的可能性很小也可能导致大的灾难(比如核电站,出问题就非常严重),纳什均衡就可能不会产生有说服力的解释。考虑如下博弈:
在这个博弈中,参与人甲会选择“下”,因为如果乙不小心(低概率)犯错误,要避免产生右上的灾难性情况。
这个例子说明,个体可能不想我们所假设的那样完全理性,在遇到高风险的情况下,人们会考虑风险,从而使得最终结果可能偏离纳什均衡战略。
囚徒困境、智猪博弈、纳什均衡与一致预期(博弈论入门学习笔记二)相关推荐
- 博弈论 纳什均衡 囚徒困境 智猪博弈
项目github地址:bitcarmanlee easy-algorithm-interview-and-practice 欢迎大家star,留言,一起学习进步 1.博弈论是什么 博弈论(game t ...
- 动态博弈、威胁与承诺(博弈论入门学习笔记四)
0 动态博弈 动态博弈:行动有先后顺序,不同的参与人在不同时点行动,先行动者的选择影响后行动者的选择空间,后行动者可以观察到先行动者做了什么选择.例如下棋.消费者和商家讨价还价.谈婚论嫁.企业之间的价 ...
- 【科普】博弈论之胆小鬼博弈、囚徒困境、智猪博弈与纳什均衡
目录 一.前言 1.1 博弈论 1.2 纳什 1.3 胆小鬼博弈 1.4 囚徒困境 1.5 智猪博弈 二.纳什均衡 2.1 纳什均衡定义 2.2 悖论 结语 一.前言 在博弈论中,纳什均衡(Nash ...
- 博弈论系列—智猪博弈
今天给大家讲解一个博弈论中很有趣的问题,智猪博弈. 01.智猪博弈 在博弈论(Game Theory)经济学中,"智猪博弈"是一个著名的纳什均衡的例子.如果不了解什么是纳什均衡,可 ...
- 漫画:什么是 “智猪博弈” ?
作者|程序员小灰 本文经授权转载自程序员小灰(ID:chengxuyuanxiaohui) 故事发生在小灰的学生时代, 小灰和大黄是同班同学...... 智猪博弈讲的是怎么一回事呢? 话说在一个猪圈里 ...
- 企业管理之智猪博弈启示
在博弈论(Game Theory)经济学中,"智猪博弈"是一个著名的纳什均衡的例子.假设猪圈里有一头大猪.一头小猪.猪圈的一头有猪食槽,另一头安装着控制猪食供应的按钮,按一下按钮会 ...
- 博弈论——万元陷阱和智猪博弈
1 万元陷阱 现将10000元拍卖给大家,各位互相竞价,以100元为加价单位,直到没有人再加价为止.出价最高者以其所出价格获得该10000元钱,同时,出家第二高的将其所出价格的数量支付给我. 请问:您 ...
- 【智猪博弈 Pigs‘ payoffs】
猪圈里有两头猪,一头大猪,一头小猪.猪圈的一边有个踏板,每踩一下踏板,在远离踏板的猪圈的另一边的投食口就会落下少量的食物.如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物.当小猪踩动踏板 ...
- 系统思考:智猪博弈(关键决策)
不知道你是否是一家创业公司的负责人,对于创业公司,我们的资源有限,每一年把有限的资源去开拓市场?还是新产品研发?还是去拓展团队?等等,都是需要一个企业来做决策的,因为我们的资源有限,不像大公司可以把资 ...
- 博弈论(2):智猪博弈
智猪博弈,可能很多人听过,在假设的猪圈里有一头大猪.一头小猪,当然我们默认这个猪是有智慧会思考的.猪圈的一头有猪食槽,另一头安装着控制猪食供应的按钮,按一下按钮会有10个单位的猪食进槽,但是谁按按钮就 ...
最新文章
- 在linux和windows下自动备份数据库
- 创建私有CA及私有CA的使用
- Markdown如何插入LaTeX公式?(在线LaTeX公式编辑器)
- 【干货分享】流程DEMO-事务呈批表
- 【英语学习】【医学】【解剖学】Atlas of Human Anatomy (6e) 的目录
- [再mark] 系统注册的dpc,枚举定时器相关的……
- 大数据之-Hadoop3.x_MapReduce_MapTask工作机制---大数据之hadoop3.x工作笔记0124
- Scp远程批量执行命令
- 基于Java的外卖订餐平台
- dedecms如何制作中英文切换的网站?
- css vue 内联_Vue学习之路第十二篇:为页面元素设置内联样式
- 盘点下玩过的解谜游戏
- 由《爆裂鼓手》引发的产品思考
- linux下安装了lxml但依然报错rom lxml import etreeModuleNotFoundError: No module named ‘lxml‘
- 自动化测试之selenium介绍
- python asyncio_Python 异步 IO系列:认识asyncio
- 计算机科学与技术专业用英文版,计算机科学与技术专业专业英文简历模板
- 阿里镜像容器服务ACR的镜像推送和拉取
- MTK平台Modem(2G、3G、4G)配置之编译环境搭建
- 圆形矩形梯形java,JAVA-打包三角型 梯形 圆形三个类,用一个程序执行入口对三类对象进行测试...