纳什均衡

纳什均衡在不同的领域的定义不尽相同,但是中心思想是相同的,即在非合作博弈中,双方为使自己利益最大化,而最终达到的一个均衡状态。在这个状态下,当所有其他人不改变策略,任意一方也不会(没有理由/动力)改变自己的策略。这时的策略组合也就是纳什均衡。

下面是百度百科中有关纳什均衡的定义:

纳什平衡(Nash equilibrium),又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,则该策略被称作支配性策略。如果任意一位参与者在其他所有参与者的策略确定的情况下,其选择的策略是最优的,那么这个组合就被定义为纳什平衡。
一个策略组合被称为纳什平衡,当每个博弈者的平衡策略都是为了达到自己期望收益的最大值,与此同时,其他所有博弈者也遵循这样的策略。

纳什均衡在经济学方面的定义:

指的是参与人的这样一种策略组合,在该策略组合上,任何参与人单独改变策略都不会得到好处。换句话说,如果在一个策略组合上,当所有其他人都不改变策略时,没有人会改变自己的策略,则该策略组合就是一个纳什均衡。

纳什均衡在数学方面的定义:

前提:博弈论也称Game Theory,一场博弈用G表示,Si表示博弈方i的策略,ui表示收益。
在博弈G={S1,…,Sn:u1,…,un}中,如果由各个博弈方的各一个策略组成的某个策略组合(s1*,…,sn*)中,任一博弈方i的策略si*,都是对其余博弈方策略的组合(s1*,…si-1,si+1,…,sn*)的最佳对策,也即ui(s1*,…si-1,si,si+1,…,snui(s1*,…si-1,sij,si+1,…,sn)对任意sij∈Si都成立,则称(s1*,…,sn*)为G的一个纳什均衡。

纳什均衡广泛运用在经济学、计算机科学、演化生物学、人工智能、会计学、政策和军事理论等方面。1994年,纳什和其他两位博弈论学家约翰·海萨尼和莱因哈德·泽尔腾共同获得了诺贝尔经济学奖。

典型示例

纳什证明了在每个参与者都只有有限种策略选择、并允许混合策略的前提下,纳什均衡一定存在

1、价格大战

生产同一样产品的若干厂家会形成一个稳定的状态,在这个状态下各家所卖的产品价格保持基本一致,在这种情况下各方就形成了一个纳什均衡。

若其中一方打破默契,开始大幅降价,以求薄利多销,获取更大利润,那么其他家便会很快跟进,互相压价。刚开始降价的一方短期内可能会增加销量和利润,但最终的结果是两败俱伤。于是两家公司可以改变原先的利益格局,通过谈判寻求新的利益评估分摊方案,也就是新的纳什均衡

由此可见,随着次数(博弈性质) 的变化,纳什均衡点也并非唯一

2、囚徒困境

假设有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:

  1. 如果一个犯罪嫌疑人坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪。如果另一个犯罪嫌疑人也作了坦白,则两人各被判刑8年
  2. 如果另一个犯罪嫌人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,共10年,而坦白者有功被减刑8年,立即释放,即0年
  3. 如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年

两人的选择见下表:表中的数字表示A,B各自的判刑结果。博弈论分析中一般都用这样的表来表示。

可以看出,对于两个嫌疑人最好的选择是两人都不承认罪行,这样两人都只判刑1年。但是两个嫌疑人是隔离的,在这个前提下,每个嫌疑人都会选择对自己利益最大化的选择,他们都会考虑:如果我抵赖,对方坦白了,那么我会判刑10年,但是对方却不需要坐牢;如果我坦白了,对方抵赖,那么我无需坐牢;就算两人都坦白,两人都坐牢8年,也比10年要少。综合以上几种情况考虑,不管他坦白与否,对我而言都是坦白了划算。两个人都会动这样的脑筋,最终两人都会选择坦白,即两人都被判8年。
这里表中的(-8,-8)即为一个纳什均衡。

3、智猪博弈

猪圈里有两头猪,一头大猪,一头小猪。猪圈的一边有个踏板,每踩一下踏板,在远离踏板的猪圈的另一边的投食口就会落下少量的食物。如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。存在以下情况:

  1. 当小猪踩动踏板时,大猪会在小猪跑到食槽之前刚好吃光所有的食物;
  2. 若是大猪踩动了踏板,则还有机会在小猪吃完落下的食物之前跑到食槽,争吃到另一半残羹

那么,两只猪各会采取什么策略?答案是:小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边;而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。

原因何在?因为,小猪踩踏板将一无所获,不踩踏板反而能吃上食物。对小猪而言,无论大猪是否踩动踏板,不踩踏板总是好的选择。反观大猪,已明知小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,所以只好亲力亲为了。

“智猪博弈”的结论似乎是,在一个双方公平、公正、合理和共享竞争环境中,有时占优势的一方最终得到的结果却有悖于他的初始理性。或者说,谁先去踩这个踏板,就会造福全体,但多劳却并不一定多得。这种情况在现实中比比皆是。

4、饿狮博弈

假设有A、B、C、D、E、F六只狮子(强弱从左到右依次排序)和一只绵羊。假设狮子A吃掉绵羊后就会打盹午睡,这时比A稍弱的狮子B就会趁机吃掉狮子A,接着B也会午睡,然后狮子C就会吃掉狮子B,以此类推。那么问题来了,狮子A敢不敢吃绵羊?

为简化说明,我们先给出此题的解法。该题须采用逆向分析法,也就是从最弱的狮子F开始分析,依次前推。假设狮子E睡着了,狮子F敢不敢吃掉狮子E?答案是肯定的,因为在狮子F的后面已没有其它狮子,所以狮子F可以放心地吃掉午睡中的狮子E。

继续前推,既然狮子E睡着会被狮子F吃掉,那么狮子E必然不敢吃在他前面睡着的狮子D。狮子D认为E不会吃它,所以会选择吃掉前面的C狮子……。

推理过程如下图:

但是,如果我们在狮子F的后面增加了一只狮子G,总数变成7只,用逆向分析法按照上题步骤再推一次,很容易得出结论:狮子G吃,狮子F不吃,E吃,D不吃,C吃,B不吃,A吃。这次的答案变成了狮子A敢吃掉绵羊。

对比两次博弈我们发现,狮子A敢不敢吃绵羊取决于狮子总数的奇偶性,总数为奇数时,A敢吃掉绵羊;总数为偶数时,A则不敢吃。因此,总数为奇数和总数为偶数的狮群博弈结果形成了两个稳定的纳什均衡点

5、硬币正反

你正在图书馆枯坐,一位陌生美女主动过来和你搭讪,并要求和你一起玩个数学游戏。美女提议:“让我们各自亮出硬币的一面,或正或反。如果我们都是正面,那么我给你3元,如果我们都是反面,我给你1元,剩下的情况你给我2元就可以了。”那么该不该和这位姑娘玩这个游戏呢?(不要因为是美女就玩啊喂(#`O′)

用表格展示更加直观:

每一种游戏依具其规则的不同会存在两种纳什均衡,一种是纯策略纳什均衡,也就是说玩家都能够采取固定的策略(比如一直出正面或者一直出反面),使得每人都赚得最多或亏得最少;或者是混合策略纳什均衡,而在这个游戏中,便应该采用混合策略纳什均衡。

(题外话)纳什均衡分类具体见百度百科:

纳什平衡可以分成两类:“纯战略纳什平衡”和“混合战略纳什平衡”。
要说明纯战略纳什平衡和混合战略纳什平衡,要先说明纯战略和混合战略
所谓纯战略是提供给玩家要如何进行赛局的一个完整的定义。特别地是,纯战略决定在任何一种情况下要做的移动。战略集合是由玩家能够施行的纯战略所组成的集合。
而混合战略是对每个纯战略分配一个机率而形成的战略。混合战略允许玩家随机选择一个纯战略。混合战略博弈均衡中要用概率计算,因为每一种策略都是随机的,达到某一概率时,可以实现支付最优。因为机率是连续的,所以即使战略集合是有限的,也会有无限多个混合战略。
当然,严格来说,每个纯战略都是一个“退化”的混合战略,某一特定纯战略的机率为1,其他的则为0。
故“纯战略纳什平衡”,即参与之中的所有玩家都玩纯战略;而相应的“混合战略纳什平衡”,之中至少有一位玩家玩混合战略。并不是每个赛局都会有纯战略纳什平衡,例如“钱币问题"就只有混合战略纳什平衡,而没有纯战略纳什平衡。不过,还是有许多赛局有纯战略纳什平衡(如协调赛局,囚徒困境和猎鹿赛局)。甚至,有些赛局能同时有纯战略和混合战略平衡。

按我们平时正常想是:两面都一样(或正或反)概率为 1/4+1/4,则其数学期望1/4 * 3 + 1/4 * 1 = 1 ,而一正一反的数学期望也是1/2 * 2 = 1。这看起来貌似是公平的,实际则不然。问题就在于硬币的正反是人为选择的,而上述公平的情况仅在抛硬币时发生。

依据混合策略,假设我们出正面的概率是x,反面的概率是1-x,美女出正面的概率是y,反面的概率是1-y。为了使利益最大化,应该在对手出正面或反面的时候我们的收益都相等(不然在这个游戏中,对方可以改变正反面出现的概率让我们的期望收入减少),由此列出方程就是:
3x + (-2)* (1-x) = -2x + 1* ( 1-x )
(对手出正面我的收益 = 对手出反面我的收益)

解方程得x=3/8。同样,美女的收益,列方程:
-3y + 2* ( 1-y)= 2y+ (-1) * ( 1-y)

解得y也等于3/8,则美女的期望收益是:
2(1-y)x+2y(1-x)-3yx-(1-y)(1-x) = 1/8元
我的期望收益是:
-2(1-y)x-2y(1-x)+3yx+(1-y)(1-x) = -1/8元

这告诉我们,在双方都采取最优策略的情况下,平均每次美女赢1/8元,而我们则亏1/8元。

也即只要美女采取了(3/8,5/8)这个方案,不论你再采用什么方案,都是不能改变局面的。如果全部出正面,每次的期望收益是 (3+3+3-2-2-2-2-2)/8=-1/8元;如果全部出反面,每次的期望收益也是(-2-2-2+1+1+1+1+1)/8=-1/8元。比如你用完全随机(1/2,1/2)策略,收益是1/2(3/8 * 3 + 5/8 * (-20)) + 1/2(3/8 * (-2) + 5/8 * 1) = -1/8;实际上,不论你用什么策略,你的收益都是-1/8,也就是说,随便玩一种策略,你都是在纳什均衡状态中的,所以,这个把戏你随便怎么玩,都是亏的

除上述示例外,纳什均衡也可以用到选举,群体之间的利益冲突,潜在战争爆发前的僵局,议会中的法案争执等情况。

参考资料

[1] 百度百科:约翰·纳什
[2] 百度百科:纳什均衡
[3] 部分定义与示例出自Bin的专栏blog.csdn.net/xbinworld

纳什均衡定义、举例、分类相关推荐

  1. 计算机网络01:因特网概述、三种交换方式、计算机网络定义和分类、计算机网络的性能指标、计算机网络体系结构

    学习链接: 湖科大教书匠 因特网概述 网络:由若干节点和连接这些节点的链路组成 互连(联)网:多个网络通过路由器互连起来,构成一个覆盖范围更大的网络,即互连(联)网:因此互联网是"网络的网络 ...

  2. AI产品经理的定义和分类

    本文作者:黄钊hanniman,图灵机器人-人才战略官,前腾讯产品经理,6年AI实战经验,9年互联网背景,微信公众号/知乎/在行ID"hanniman",饭团"AI产品经 ...

  3. cgo引用定义不一致_应急照明、消防应急照明和疏散指示系统的定义与分类

    ​每天6分钟解决一个机电问题. 如何设计消防应急照明系统一直是建筑电气的难题,各省市设计院.消防部门.审图专家.地产电气技术管理人员对此都有不同的理解和观点,导致做法也不一致:究其原因,是各职能部门的 ...

  4. 计算机网络按定义分,计算机网络定义及其分类

    <计算机网络定义及其分类>由会员分享,可在线阅读,更多相关<计算机网络定义及其分类(26页珍藏版)>请在人人文库网上搜索. 1.第一章 绪 论,本章节介绍计算机网络定义及其分类 ...

  5. 计算机网络的定义功能和分类,计算机网络的定义和分类.ppt

    计算机网络的定义和分类.ppt 一.计算机网络定义1.计算机网络 目的 在于实现资源共享和信息交流. 关键点 地理上分散 独立功能 通信系统 资源 信息交流 一.计算机网络定义2.分布式系统 透明(t ...

  6. 55 MM配置-评估和科目设置-定义账户分类参考

    业务背景:定义账户分类参考 事务码:OMSK SPRO路径:物料管理->评估和科目设置->科目确定->无导向的科目确定->定义评估类->定义账户分类参考 第1步,SPRO ...

  7. 什么是决定计算机内部寄存器,问题解答之 计算机中寄存器定义,分类

    1.计算机中寄存器定义,分类寄存器是CPU内部的元件,寄存器拥有非常高的读写速度,所以在寄存器之间的数据传送非常快.寄存器的用途:1.可将寄存器内的数据执行算术及逻辑运算.2.存于寄存器内的地址可用来 ...

  8. B端产品-定义、分类、竞品分析、与C端产品的区别

    转载请注明预见才能遇见的博客:http://my.csdn.net/ 原文地址:https://blog.csdn.net/pcaxb/article/details/108297678 B端产品-定 ...

  9. 超声影像对2010 ACR/EULAR RA分类标准的影响: 结合两种不同的受累关节灰阶滑膜炎超声定义的分类标准...

    原文 译文 The Impact of Ultrasonography on the Classification of Rheumatoid Arthritis with 2010 ACR/EULA ...

  10. 1.1 统计学习方法的定义与分类

    统计学习方法的定义与分类 统计学习的概念 统计学习的定义 统计学习运用到的领域 统计学习的步骤 统计学习的分类 统计学习的概念 统计学习的定义 统计学习 (Statistical Machine Le ...

最新文章

  1. ActiviteX 服务
  2. 【Prometheus】问题记录
  3. autowired_@Autowired所有的东西!
  4. extmail html文件丢失,extmail/extman登录界面无法显示的故障解决
  5. dbeaver导出excel文件_vue将数据导出为excel文件就是如此简单
  6. C++新特性探究(十一):enum class(struct)
  7. bzoj 1015 [JSOI2008]星球大战starwar
  8. COMPATIBILITY参数需要是8.1.0.0.0或更大?
  9. 微电子学概论简要笔记
  10. [ActionScript 3.0] 通过as3操作web内容
  11. fileutils java_FileUtils类的应用实例教程
  12. 计算机绘图中级,计算机绘图(中级)
  13. 杭州电子科技大学计算机研究生很好考吗,杭州电子科技大学考研难吗?一般要什么水平才可以进入?...
  14. 牛腩——SQLhelper
  15. 互联网公司对Android,iOS开发工程师的职位要求
  16. windows硬盘数据安全处理工具
  17. python为什么运行不了_终端里为什么无法运行python?
  18. NYOJ239 月老的难题 二分图最大匹配(前向星)
  19. 增量式旋转编码器的使用,以arduino为例
  20. 1279: C语言:概述2(输出三角形图案)

热门文章

  1. 解决 c++ 字符转转浮点型数据且保留所有小数
  2. 优秀程序员的博客有哪些?(2021 年 3 月版)
  3. 关于Mysql中的生日提醒
  4. 头孢是什么?什么是双硫仑反应?//2021-2-11
  5. 前端vue使用ECharts如何制作精美统计图
  6. CocosCreater 发布apk接穿山甲广告SDK(一)
  7. 基于GeoEvent Processor的物联网应用案例赏析
  8. DayDayUp:平均每篇文章1毛! 本博主自2020年6月1日起,如有任何问题可在博客贴吧留言或者私信博主(包括并不限于GUI软件编写、安装及编程语言中的bug、AI算法设计等),非诚勿扰!
  9. oracle怎么截取long类型,如何把long类型的值取出来
  10. 剑网3手游微信52服务器灵霄峡,剑网3指尖江湖灵霄峡宝箱位置详解攻略