目录

一、囚徒困境

二、纳什均衡

三、帕雷托最优和帕雷托改进


一、囚徒困境

参考囚徒困境_哔哩哔哩_bilibili

以前我们可能会听到有人说当每人追求自己的最大利益时,社会才会达到最好的利益?这种观点是不对的。那么我们用囚徒困境来反驳。

囚徒困境,是最经典的博弈论模型,探讨如何实现个人的利益最大化和如何实现集体的利益最大化。

  • 如果同时合作,那么每人获得10年牢狱;
  • 如果同时背叛,那么每人获得20年牢狱;

站在小红的角度上,他会想如果小蓝选择合作那么我最好选择背叛,这样只要坐5年的牢,而不是10年; 如果小蓝选择背叛那么我最好也选择背叛,这样只要坐20年的牢,而不是30年。所以无论小蓝怎么选择,小红永远都会选择背叛,背叛是他的最优选择。同样的,小蓝也会这样想。

就这样,他们通过对自己的利益最大化考虑,会同时选择背叛,这样他俩的集体利益并不能达到最优,而是达到了最差,每人坐20年的牢。

通过上面的例子,我们可以看出,当每人追求自己的最大利益的时候,社会并不一定会达到最好的利益。也有很多相似的例子,比如自行车比赛或长跑比赛中, 很多人不喜欢冲在第一的位置,而是喜欢跟跑。

二、纳什均衡

参考纳什均衡_哔哩哔哩_bilibili

纳什均衡的简单表示就是,每个人的策略都是对其他人的策略的最优反应。

◼ 以囚徒困境为例

囚徒困境中,双方同时选择背叛,就是一个纳什均衡。因为小红选择合作的时候,小蓝的最优反应就是背叛;小红选择背叛的时候,小蓝的最优反应依然还是背叛;所以小蓝对小红的所有最优反应都是被背叛。类似的,小红也是。

纳什均衡还有这样一个前提,在角色圈中的个体是独立的,不合作的,也不能相互沟通。然后没搞过个体在猜测其他个体做出的动作之后,给出自己的动作。通俗来说,给定你的策略,我的策略是最好的;给定我的策略,你的策略也是你最好的。即,双方在对方给定的策略下,不愿意调整自己的策略。

博弈双方都明白,谁改变策略谁就吃亏。

有些策略是有多个纳什均衡的。当一个博弈有多个纳什均衡点的时候,其实我们无法预测最终的结果。

比如我们更改一下囚徒困境的条件,如果一个人背叛另一个人合作的时候,背叛判处15年而不是5年,那么结果会怎么样呢?

站在小红的角度上,他会想如果小蓝选择合作那么我最好也选择合作, 如果小蓝选择背叛那么我最好也选择背叛。同样的,小蓝也会这样想。

那么这四种情况都会出现,但是如果小红知道小蓝选择的策略,那么小红根据小蓝的策略选择自己的策略,同时合作和同时背叛都是趋于稳定的,就只会出现两种情况。这就是有多个纳什均衡点的例子。

◼ 以猎鹿为例

在上图的《论人类不平等的起源和基础》书中,也提到了一个例子:两个猎人,

  • 如果同时射猎小鹿,那么每人获得2个价值;
  • 如果同时射猎小兔子,那么每人获得1个价值;

这个例子,与更改过的囚徒困境是一样的,也是有2个纳什均衡点。

◼ 总结:

  • 如果出现多个纳什均衡点,我们就需要通过其他途径来改变博弈条件或者获取共同信息,和对手达成共识,使博弈尽快达到均衡。
  • 如果只有一个纳什均衡点,那么博弈的结果就是可预测的。

这样可以更好的帮助企业做出决策。

三、帕雷托最优和帕雷托改进

参考【科普】+帕雷托最优, 利己不损人的理论_哔哩哔哩_bilibili

让我们来聊一聊帕雷托最优和帕雷托改进,在经济学和博弈论中,除了 约翰 纳什 的纳什均衡 以外, 还有一个非常重要的概念:帕雷托最优和帕雷托改进,这两个概念可以帮助人们处理多目标任务,评价整个体系的优劣。

帕累托最优, 在不损害其他人或任务的情况下,已经无法继续改善某些人或任务的境况。 简单的说,就是“ 发展自己的同时不损害别人”。

比如现在我们有十个苹果,目前的情况是小红分到了6个,小蓝分到了3个,此时还没有达到帕雷托最优。

帕累托改进:达到帕雷托最优的过程。

这时,小红摘掉了树上最后一个苹果,就达到了帕雷托最优,这个举动就是帕雷托改进。

在达到了帕雷托最优的体系之后,如果小蓝想要增加自己的苹果数量,那么他只能去争抢小红的苹果。所以在达到了帕雷托最优的体系之后,体系的任何改变都会损害他人

影响帕雷托最优,除了资源总量之外,还有它的评价标准

在学校,我们常用的评价标准就是排名,但是以排名作为评价标准,整个体系不会达到帕雷托最优,也不会出现帕雷托改进的情况。因为任何一个人名词的上升都会导致其他人名次的下降。

那么怎么才能让最多的人高兴呢?只能让第一名退后到最后一名,这样就会使得其他所有人都满意,但是这并没有解决问题,同样都会有新的第一名,新的第一名又退后到最后一名。

所以这种以排名作为评价标准,经常会出现均贫,仇富心理。那么不存在帕雷托最优,也不存在帕雷托改进,这对体系的发展是不好的。

但是,如果我们换一个评价标准,以知识积累作为评价标准,有利于体系的发展。

囚徒困境,纳什均衡,帕雷托最优和帕雷托改进相关推荐

  1. 博弈论笔记1:囚徒困境与纳什均衡

    1 个体最优与社会最优 1.1 社会基本问题 社会:个体之间有互动行为&相互依赖的群体 羊群效应:大家做什么,我就跟着做什么,不管对错和原因 协调问题:两人迎面走来,谁左谁右?(核心:人们如何 ...

  2. 博弈论 纳什均衡 囚徒困境 智猪博弈

    项目github地址:bitcarmanlee easy-algorithm-interview-and-practice 欢迎大家star,留言,一起学习进步 1.博弈论是什么 博弈论(game t ...

  3. 【科普】博弈论之胆小鬼博弈、囚徒困境、智猪博弈与纳什均衡

    目录 一.前言 1.1 博弈论 1.2 纳什 1.3 胆小鬼博弈 1.4 囚徒困境 1.5 智猪博弈 二.纳什均衡 2.1 纳什均衡定义 2.2 悖论 结语 一.前言 在博弈论中,纳什均衡(Nash ...

  4. 纳什均衡+帕雷托最优-通俗解答

    在知乎的纳什均衡回答里看到这么一个观点: 1. 三个火枪手中那句名言:All for one, one for all (人人为我,我为人人),我的理解是,贵族武士之间,通过自利和利他的行为实现共同目 ...

  5. 北大清华的状元之争:一个典型的囚徒困境

    北大清华的状元之争是一个典型的囚徒困境. 囚徒困境是社会合作面临的最大难题,它深刻揭示了个体理性和集体理性之间的矛盾和冲突:个体按照自身利益最大化的原则采取对自己最有利的占优战略,得到的却不一定是自己 ...

  6. 漫画:什么是囚徒困境?

    戳蓝字"CSDN云计算"关注我们哦! 作者 | 小灰 责编 | 刘丹 故事发生在小灰小时候...... 囚徒困境讲的是一件怎样的事情呢? 话说某一天,警察抓到了嫌疑犯小A和小B,虽 ...

  7. 终于有人把内卷和囚徒困境讲明白了

    导读:内卷不但不会创造价值,而且会危害每一个人. 作者:王见现 来源:大数据DT(ID:hzdashuju) ▲通往深渊 01 小镇的故事 1. 什么是内卷 很久很久以前,地球上有一个小镇.小镇上有很 ...

  8. 风变编程课 囚徒困境 答案_当您对所有这些有用的在线编程课程感到不知所措时,如何摆脱困境...

    风变编程课 囚徒困境 答案 by Walt Schlender 由Walt Schlender 当您对所有这些有用的在线编程课程感到不知所措时,如何摆脱困境 (How to get unstuck w ...

  9. 囚徒困境、价格大战与 iPhone 的价格

    静态/动态,完全/不完全: 完全信息静态博弈: 不完全信息静态博弈: 完全信息动态博弈: 不完全信息动态博弈: 囚徒困境实际上反映了一个深刻的哲学问题:个人利益与集体利益的矛盾.个人为了自己利益的最大 ...

最新文章

  1. 数据结构---线段树
  2. python 笔记 异常处理
  3. Linux怎么查看设置系统语言包
  4. springsession 实现session 共享
  5. 在同一个workprocess里对两张表分别使用online update和update function module update
  6. java多线程创建runnable_Java线程池和runnables创建runnables
  7. gin的Bindxxx和ShouldBindxxx的区别
  8. jQuery (二)
  9. Java 之常用API(一)
  10. python函数命名空间_python (函数命名空间和作用域)
  11. 十二款世界顶级杀毒软件下载,有序列号
  12. java基础学习(6)疯狂java讲义第5章课后习题解答源码
  13. Luogu4712「生物」能量流动
  14. 实现一个数据流中,随时可以取得中位数
  15. uniapp下载文件 例(Word)以及下载其他文件,Word文件的转发,保存,查看
  16. 基于C#实现的小型动物识别推理系统
  17. Hi3518E音频部分设计
  18. 使用余弦相似度算法计算文本相似度
  19. JavaScript如何截取指定位置的字符串
  20. 量化交易入门笔记-小市值股票策略

热门文章

  1. 利用新型蓝牙攻击,开走特斯拉 Model 3 和 Model Y
  2. 教你如何秒杀12306,JAVA程序抢票成功 分享 附截图
  3. 时间紧迫加快速度提高工作效率这是我的原则
  4. HTML实例之下拉菜单
  5. 数字化如何赋能电力调度、提升电网调度精准度灵活性、提升新能源消纳能力?互联网人如何参与泛在电力物联网和能源互联网?
  6. align_corners 的意义
  7. UEFI开发与调试---QEMU虚拟盘的创建与修改
  8. 【关于回归结果F值缺失的处理方式】
  9. HDC.Cloud 2021|华为云数据使服务DAYU,加速数据价值释放
  10. 基于Keras实现加密过的数据的卷积神经网络