混合策略纳什均衡——附例题及解析
目录
引入
混合纳什均衡
例题
求法
引入
假设这样一种对局,甲乙两人抽扑克牌,扑克牌只有两种花色,红和黑,两张牌花色相同算甲胜,反之乙胜,那么甲乙双方应该如何设定自己抽出不同花色的概率呢?
比如,设甲抽红牌的概率P=60%,那么黑牌概率就是1-P=40%,这样显然不合理
因为B会发现甲出红牌的概率明显大于黑牌,干脆B全出黑牌,这样就有60%的情况是B胜,A显然赢不了
根据生活经验我们很容易推测出P应该取50%,这样B全出一种牌最终获胜的概率也是50%,这样对B来说没有任何优势,很符合A的选择。
混合纳什均衡
(P,Q)是一个组合,并不是前面引入的四个格子里的某一个格子,而是这四个格子里面怎么样用百分数组合起来
所以混合策略求解最终的结果就是(P,Q)这样的一个组合,这个组合什么意思呢,画到图中大概下图这个样子
例题
比如上题,显然这就是一个扔硬币判定输赢的游戏(两个硬币同正或同反就判A赢,反之判B赢,显然最优混合策略为0.5,0.5)
假设我们不知道他们的策略,下面来求解
设A的策略为P,即他扔的硬币正面的概率为P,反面就是(1-P),在这种条件下我们来判断B的效用
求法
B为正面:
-1*P+1*(1-P)
B为反面:
1*P+(-1)*(1-P)
我们要让B在A的两种选择下所获得的效用相等(如果不相等就说明B的两个选择中其中一个明显在概率上优于另一个,如果这样的话B只需要一直选择优势的一种就可以打败A)
注意,我们要求的其实是A的选择的概率P,所以站在A的角度显然不能让B发现自己的两种选择里有一种更优的选择,而是让这两种选择的效用在概率上都一样,因此,我们让这两个式子相等
-1*P+1*(1-P)= 1*P+(-1)*(1-P)
求出P=0.5
这样我们就求出了P,下面来求Q
设B选择正面的概率为Q,反面就是(1-Q),那么A在此条件下不同选择的效用就为
A为正面:1*Q+(-1)*(1-Q)
A为反面:(-1)*Q+1*(1-Q)
同理使两者相等得出Q=0.5
所以混合战略纳什均衡为{P,Q}={0.5概率选正面,0.5概率选正面}
注意:这里P,Q都为0.5,如果遇到题目数值不等,要区分P,Q分别指的是哪一方的哪种选择,默认P属于A方,Q属于B方,所以要区分PQ是这两方的哪种选择,在这道题里P是A选正面的概率,Q是B选正面的概率,其余同理
混合策略纳什均衡——附例题及解析相关推荐
- 计组期末复习之例题与解析
计组例题与解析 第一章:概论 无 第二章:运算方法和运算器 例2-1 求补码 对于正数,不变 对于负数,符号位不变,数值位取反加一 例2-2 数轴形式表示原码.反码.补码范围 第一位符号位,后面是数值 ...
- 何时是PNE(纯策略纳什均衡)?何时是MNE(混合策略纳什均衡)?
何时是PNE(纯策略纳什均衡)?何时是MNE(混合策略纳什均衡)? 题目: 何时是PNE(纯策略纳什均衡)?何时是MNE(混合策略纳什均衡)? +----------------+---------- ...
- 分治算法小结(附例题详解)
分治算法小结(附例题详解) 我的理解: 分治算法我的理解就是看人下菜碟,我们要解决的问题就好像一群人构成的集体,要我们解决这个问题,那我们就要满足这群人里面每个人不同的需求,也就是写出解决的代码,把每 ...
- 混合策略纳什均衡计算
为了了解博弈论中引入"混合策略"概念的动机,我们来看用"划线法"对相当简单的"猜谜博弈"求解的结果,其结果如图8.3.1所示. 求解的答案是 ...
- 第七章:混合策略与混合策略纳什均衡
1. 混合策略 混合策略收益函数 uiu_iui 案例一 2. 混合策略纳什均衡 案例二 3. 策略组成为混合纳什均衡的必要充分条件 必要和充分条件的含义 上面的必要和充分条件有着下列含义: 给定一 ...
- c语言raptor函数,RAPTOR程序设计例题参考解析.doc
RAPTOR程序设计例题参考解析 RAPTOR程序设计 一.顺序结构编程 1.输入任意一个华氏温度值,然后将其转换成摄氏温度输出.算法:c = 5 / 9 (f - 32) 2.输入任意三角形的三边之 ...
- 动态规划类问题解题步骤 --附例题(小偷问题)
动态规划类问题解题步骤 --附例题(小偷问题) 动态规划 基本思想 适用情况 优点 解题步骤 实例分析 问题 解题步骤 动态规划 基本思想 动态规划背后的基本思想非常简单.大致上,若要解一个给定问题, ...
- PrepareStatement用法(附源码解析)
PrepareStatement 基本用法 1. 加载驱动 首先在pom.xml 中引入 mysql 依赖 <dependency><groupId>mysql</gro ...
- 数学规划详解(附例题及部分Python实现)
数学规划详解(附例题及Python实现) 例题来自于清风老师的数学建模课,个人认为讲的非常好,欢迎大家购买 一.概述 1.1 定义 数学规划是运筹学的一个分支,在约束条件下,按照目标函数来寻求计划管理 ...
最新文章
- eclipse 变成中文
- 业界首个实时多目标跟踪系统开源
- java soa例子_哪位大牛能举个实例讲下SOA与传统架构的区别?
- 【Python】python 反射机制在实际的应用场景讲解
- 基础学习总结(五)---baseAdapter、ContentProvider
- mysql 范围优化_如何优化mysql的范围查询
- ASP.NET MVC 入门1、简介
- 复杂风控场景下,如何打造一款高效的规则引擎
- Linux系统的优缺点
- lnmp架构下,织梦二级域名访问m文件夹出现 500错误
- mysql表索引类型修改_MySQL常用的建表、添加字段、修改字段、添加索引SQL语句写法总结...
- AI算法工程师的一些含泪经验
- Adobe AIR简单的缓存技术
- 机器学习的最佳入门学习资源【转】
- 面试题之——多线程详解
- Java高级面试题!传智播客java基础入门pdf
- 两张图轻松搞懂 二进制 八进制 十进制 十六进制 之间的转换关系
- length php,length与size()使用对比
- Android布局总汇篇(XXXLayout)
- 触摸开关模块,TTP223