囚徒困境,纳什均衡,帕雷托最优和帕雷托改进
目录
一、囚徒困境
二、纳什均衡
三、帕雷托最优和帕雷托改进
一、囚徒困境
参考囚徒困境_哔哩哔哩_bilibili
以前我们可能会听到有人说当每人追求自己的最大利益时,社会才会达到最好的利益?这种观点是不对的。那么我们用囚徒困境来反驳。
囚徒困境,是最经典的博弈论模型,探讨如何实现个人的利益最大化和如何实现集体的利益最大化。
- 如果同时合作,那么每人获得10年牢狱;
- 如果同时背叛,那么每人获得20年牢狱;
站在小红的角度上,他会想如果小蓝选择合作那么我最好选择背叛,这样只要坐5年的牢,而不是10年; 如果小蓝选择背叛那么我最好也选择背叛,这样只要坐20年的牢,而不是30年。所以无论小蓝怎么选择,小红永远都会选择背叛,背叛是他的最优选择。同样的,小蓝也会这样想。
就这样,他们通过对自己的利益最大化考虑,会同时选择背叛,这样他俩的集体利益并不能达到最优,而是达到了最差,每人坐20年的牢。
通过上面的例子,我们可以看出,当每人追求自己的最大利益的时候,社会并不一定会达到最好的利益。也有很多相似的例子,比如自行车比赛或长跑比赛中, 很多人不喜欢冲在第一的位置,而是喜欢跟跑。
二、纳什均衡
参考纳什均衡_哔哩哔哩_bilibili
纳什均衡的简单表示就是,每个人的策略都是对其他人的策略的最优反应。
◼ 以囚徒困境为例
囚徒困境中,双方同时选择背叛,就是一个纳什均衡。因为小红选择合作的时候,小蓝的最优反应就是背叛;小红选择背叛的时候,小蓝的最优反应依然还是背叛;所以小蓝对小红的所有最优反应都是被背叛。类似的,小红也是。
纳什均衡还有这样一个前提,在角色圈中的个体是独立的,不合作的,也不能相互沟通。然后没搞过个体在猜测其他个体做出的动作之后,给出自己的动作。通俗来说,给定你的策略,我的策略是最好的;给定我的策略,你的策略也是你最好的。即,双方在对方给定的策略下,不愿意调整自己的策略。
博弈双方都明白,谁改变策略谁就吃亏。
有些策略是有多个纳什均衡的。当一个博弈有多个纳什均衡点的时候,其实我们无法预测最终的结果。
比如我们更改一下囚徒困境的条件,如果一个人背叛另一个人合作的时候,背叛判处15年而不是5年,那么结果会怎么样呢?
站在小红的角度上,他会想如果小蓝选择合作那么我最好也选择合作, 如果小蓝选择背叛那么我最好也选择背叛。同样的,小蓝也会这样想。
那么这四种情况都会出现,但是如果小红知道小蓝选择的策略,那么小红根据小蓝的策略选择自己的策略,同时合作和同时背叛都是趋于稳定的,就只会出现两种情况。这就是有多个纳什均衡点的例子。
◼ 以猎鹿为例
在上图的《论人类不平等的起源和基础》书中,也提到了一个例子:两个猎人,
- 如果同时射猎小鹿,那么每人获得2个价值;
- 如果同时射猎小兔子,那么每人获得1个价值;
这个例子,与更改过的囚徒困境是一样的,也是有2个纳什均衡点。
◼ 总结:
- 如果出现多个纳什均衡点,我们就需要通过其他途径来改变博弈条件或者获取共同信息,和对手达成共识,使博弈尽快达到均衡。
- 如果只有一个纳什均衡点,那么博弈的结果就是可预测的。
这样可以更好的帮助企业做出决策。
三、帕雷托最优和帕雷托改进
参考【科普】+帕雷托最优, 利己不损人的理论_哔哩哔哩_bilibili
让我们来聊一聊帕雷托最优和帕雷托改进,在经济学和博弈论中,除了 约翰 纳什 的纳什均衡 以外, 还有一个非常重要的概念:帕雷托最优和帕雷托改进,这两个概念可以帮助人们处理多目标任务,评价整个体系的优劣。
帕累托最优, 在不损害其他人或任务的情况下,已经无法继续改善某些人或任务的境况。 简单的说,就是“ 发展自己的同时不损害别人”。
比如现在我们有十个苹果,目前的情况是小红分到了6个,小蓝分到了3个,此时还没有达到帕雷托最优。
帕累托改进:达到帕雷托最优的过程。
这时,小红摘掉了树上最后一个苹果,就达到了帕雷托最优,这个举动就是帕雷托改进。
在达到了帕雷托最优的体系之后,如果小蓝想要增加自己的苹果数量,那么他只能去争抢小红的苹果。所以在达到了帕雷托最优的体系之后,体系的任何改变都会损害他人。
影响帕雷托最优,除了资源总量之外,还有它的评价标准。
在学校,我们常用的评价标准就是排名,但是以排名作为评价标准,整个体系不会达到帕雷托最优,也不会出现帕雷托改进的情况。因为任何一个人名词的上升都会导致其他人名次的下降。
那么怎么才能让最多的人高兴呢?只能让第一名退后到最后一名,这样就会使得其他所有人都满意,但是这并没有解决问题,同样都会有新的第一名,新的第一名又退后到最后一名。
所以这种以排名作为评价标准,经常会出现均贫,仇富心理。那么不存在帕雷托最优,也不存在帕雷托改进,这对体系的发展是不好的。
但是,如果我们换一个评价标准,以知识积累作为评价标准,有利于体系的发展。
囚徒困境,纳什均衡,帕雷托最优和帕雷托改进相关推荐
- 博弈论笔记1:囚徒困境与纳什均衡
1 个体最优与社会最优 1.1 社会基本问题 社会:个体之间有互动行为&相互依赖的群体 羊群效应:大家做什么,我就跟着做什么,不管对错和原因 协调问题:两人迎面走来,谁左谁右?(核心:人们如何 ...
- 博弈论 纳什均衡 囚徒困境 智猪博弈
项目github地址:bitcarmanlee easy-algorithm-interview-and-practice 欢迎大家star,留言,一起学习进步 1.博弈论是什么 博弈论(game t ...
- 【科普】博弈论之胆小鬼博弈、囚徒困境、智猪博弈与纳什均衡
目录 一.前言 1.1 博弈论 1.2 纳什 1.3 胆小鬼博弈 1.4 囚徒困境 1.5 智猪博弈 二.纳什均衡 2.1 纳什均衡定义 2.2 悖论 结语 一.前言 在博弈论中,纳什均衡(Nash ...
- 纳什均衡+帕雷托最优-通俗解答
在知乎的纳什均衡回答里看到这么一个观点: 1. 三个火枪手中那句名言:All for one, one for all (人人为我,我为人人),我的理解是,贵族武士之间,通过自利和利他的行为实现共同目 ...
- 北大清华的状元之争:一个典型的囚徒困境
北大清华的状元之争是一个典型的囚徒困境. 囚徒困境是社会合作面临的最大难题,它深刻揭示了个体理性和集体理性之间的矛盾和冲突:个体按照自身利益最大化的原则采取对自己最有利的占优战略,得到的却不一定是自己 ...
- 漫画:什么是囚徒困境?
戳蓝字"CSDN云计算"关注我们哦! 作者 | 小灰 责编 | 刘丹 故事发生在小灰小时候...... 囚徒困境讲的是一件怎样的事情呢? 话说某一天,警察抓到了嫌疑犯小A和小B,虽 ...
- 终于有人把内卷和囚徒困境讲明白了
导读:内卷不但不会创造价值,而且会危害每一个人. 作者:王见现 来源:大数据DT(ID:hzdashuju) ▲通往深渊 01 小镇的故事 1. 什么是内卷 很久很久以前,地球上有一个小镇.小镇上有很 ...
- 风变编程课 囚徒困境 答案_当您对所有这些有用的在线编程课程感到不知所措时,如何摆脱困境...
风变编程课 囚徒困境 答案 by Walt Schlender 由Walt Schlender 当您对所有这些有用的在线编程课程感到不知所措时,如何摆脱困境 (How to get unstuck w ...
- 囚徒困境、价格大战与 iPhone 的价格
静态/动态,完全/不完全: 完全信息静态博弈: 不完全信息静态博弈: 完全信息动态博弈: 不完全信息动态博弈: 囚徒困境实际上反映了一个深刻的哲学问题:个人利益与集体利益的矛盾.个人为了自己利益的最大 ...
最新文章
- 数据结构---线段树
- python 笔记 异常处理
- Linux怎么查看设置系统语言包
- springsession 实现session 共享
- 在同一个workprocess里对两张表分别使用online update和update function module update
- java多线程创建runnable_Java线程池和runnables创建runnables
- gin的Bindxxx和ShouldBindxxx的区别
- jQuery (二)
- Java 之常用API(一)
- python函数命名空间_python (函数命名空间和作用域)
- 十二款世界顶级杀毒软件下载,有序列号
- java基础学习(6)疯狂java讲义第5章课后习题解答源码
- Luogu4712「生物」能量流动
- 实现一个数据流中,随时可以取得中位数
- uniapp下载文件 例(Word)以及下载其他文件,Word文件的转发,保存,查看
- 基于C#实现的小型动物识别推理系统
- Hi3518E音频部分设计
- 使用余弦相似度算法计算文本相似度
- JavaScript如何截取指定位置的字符串
- 量化交易入门笔记-小市值股票策略