混合策略与混合策略纳什均衡
混合战略是指博弈的参与者以一定的概率去选择某种战略。这类博弈虽然在一次操作中有输有赢,但将这个博弈多次重复进行,可以研究各个战略应赋予多大的概率,能获得最大的期望(平均)收益。
一、混合策略
混合策略博弈和混合策略纳什均衡
分析猜硬币博弈。盖硬币一方必须:1、保证自己的策略选择不能被猜硬币一方预先知道;2、如果博弈多次进行,那么盖硬币一方的策略必须是无规律的。3、正面和反面的概率必须是0.5。对于猜硬币方也是如此。
猜硬币游戏中,两个参与人的最佳策略都是以0.5的概率选择正面,0.5的概率选择反面。这种参与人以一定的概率分布在可选策略中随机选择的决策方式称为"混合博弈"(mixed strategies),相应的前面分析中参与人只选择特定的策略的博弈称为"纯策略"
例:猜硬币博弈,双方都以0.5的概率选择正面和反面时的期望效用函数:
猜硬币方1:u1(0.5,0.5)=0.5*[1*0.5+(-1*0.5)]+0.5*[(-1*0.5+1*0.5]
给定对方的混合策略,参与人的最优混合策略是使其期望效用函数最大化的混合策略。所有参与人的最优混合策略的组合即混合策略纳什均衡。
定义混合策略纳什均衡:在n个参与人的博弈G={S1,...Sn;u1,...un}中,混合策略组合构成一个纳什均衡,如果对于所有的i=1,2...,n下式成立:
也就是说,如果一个策略组合使任何一个参与人的策略都是相对于其他参与人的策略的最佳策略,这个策略就构成一个纳什均衡,不管这个策略是混合策略还是纯策略。
解混合策略纳什均衡的方法:
1、最大化支付法:即最大化各个参与人的效用函数。
2、支付相等法:根据前面分析的猜硬币博弈中参与人的策略的思路,每个参与人的混合策略都使其余参与人的任何纯策略的期望支付相等,因此,解混合策略纳什均衡可以令参与人的各个纯策略支付相等,构成方程组求解。
二、社会福利博弈
解法1、最大化期望效用函数法:
假定政府的混合策略是,流浪汉的混合策略是:。
政府的期望效用函数为:
求导得最优化一阶条件:
同理,最大化流浪汉效用函数得政府救济的概率是:
解法二:期望支付相等法
假设流浪汉的混合策略为(r,1-r),政府选择纯策略救济的期望支付是:
选择纯策略不救济的期望支付是:
4r-1=-r r*=0.2
同理可得政府救济的概率为:
三、多重均衡博弈与混合策略
一、性别战
期望支付相等法:
妻子的混合策略(w,1-w)应该使丈夫看足球与时装表演的期望支付相同:
w*1+(1-w)*0=w*0+(1-w)*3
w*=0.25
丈夫的混合策略应使妻子的期望支付相等:
h*2+(1-h)*0=h*0+(1-h)*1
h*=1/3
在混合策略纳什均衡((1/3,2/3),(0.75,0.25))下,妻子的期望支付是:
w*[h*2+(1-h)*0]+(1-w)[h*0+(1-h)*1]=0.67
丈夫的期望支付是:
h[w*1+(1-w)*0]+(1-h)[ w*0+(1-w)*3]=0.75
都小于双方协商沟通时得到的支付。
转载于:https://www.cnblogs.com/sprite_bx/archive/2010/03/23/1692867.html
混合策略与混合策略纳什均衡相关推荐
- 第七章:混合策略与混合策略纳什均衡
1. 混合策略 混合策略收益函数 uiu_iui 案例一 2. 混合策略纳什均衡 案例二 3. 策略组成为混合纳什均衡的必要充分条件 必要和充分条件的含义 上面的必要和充分条件有着下列含义: 给定一 ...
- 混合策略纳什均衡计算
为了了解博弈论中引入"混合策略"概念的动机,我们来看用"划线法"对相当简单的"猜谜博弈"求解的结果,其结果如图8.3.1所示. 求解的答案是 ...
- 矩阵博弈及其纳什均衡
在众多博弈模型中,占有重要地位的是二人有限零个对策,又称为矩阵博弈,这对策是目前为止在理论研究和求解方法方面都比较完善的一个博弈. 矩阵博弈 矩阵博弈就是二人有限零和博弈,或有限二人零和博弈: 在众多 ...
- 何时是PNE(纯策略纳什均衡)?何时是MNE(混合策略纳什均衡)?
何时是PNE(纯策略纳什均衡)?何时是MNE(混合策略纳什均衡)? 题目: 何时是PNE(纯策略纳什均衡)?何时是MNE(混合策略纳什均衡)? +----------------+---------- ...
- 混合策略纳什均衡——附例题及解析
目录 引入 混合纳什均衡 例题 求法 引入 假设这样一种对局,甲乙两人抽扑克牌,扑克牌只有两种花色,红和黑,两张牌花色相同算甲胜,反之乙胜,那么甲乙双方应该如何设定自己抽出不同花色的概率呢? 比如,设 ...
- 首都师范 博弈论 3 2 4混合策略纳什均衡
3 2 4混合策略纳什均衡
- 博弈论中的混合策略纳什均衡求解
混合策略的纳什均衡求解 前言: 均衡均衡,博弈论问题,让我们一起来求解吧!!均为个人原创,转载请告知,谢谢,祝好!
- 首都师范 博弈论 3 4 1非零和博弈的混合策略纳什均衡
3 4 1非零和博弈的混合策略纳什均衡
- matplotlib三维画图之观察博弈论混合策略下纳什均衡点
参考链接: 博弈论入门20讲之第16讲-猜谜游戏-散户如何赢庄家 游戏背景: 我的期望是: 你的期望是: 使用Python的matplotlib画图: import numpy as np impor ...
- 国科大高级人工智能-总结
文章目录 1.概论 2. 搜索 A\*最优性 三个传教士与野人 3.神经网络 RBM DBN DBM hopfield比较 结构及特性 逐层贪婪训练与CD BP GAN 4.逻辑 一个永远无法归结结束 ...
最新文章
- LINUX 查找tomcat日志关键词
- iOS - OC NSSize 尺寸
- 机器学习从入门到精通系列之BP神经网络理论知识详解
- 静态变量和实例变量的区别
- mysql 同步更新_MySQL slave 不能同步更新
- qt combox选中消息_Qt+imx6编写的楼宇对讲管理平台
- iPhone传屏到android,冠树最新款2画面无线传屏设备,苹果/win系统电脑可以轻松快速无线传屏到投影...
- [工具库]JFileDownloader工具类——多线程下载网络文件,并保存在本地
- java学习(56):接口之间的继承续
- lua mysql 字符串截取_Lua 截取字符串(截取utf-8格式字符串)
- Java调用大华车牌识别摄像头_第三方软件调用大华网络摄像头监控
- 怎么将PDF转换成Word?PDF转Word如何不乱码?
- 360p2刷无线打印服务器,【联网版】360路由器P2刷tomato固件小白教程
- VUE提示Gradient has outdated direction syntax
- FPGA系列7——Xilinx复数乘法器(Complex Multiplier v6.0)使用小结
- 多个域名泛域名证书和多域名证书
- 【2021杭电多校赛】2021“MINIEYE杯”中国大学生算法设计超级联赛(8)
- CityMaker学习教程13 osg模型的移动
- Python: 蛇形填空(每日一题)
- vite+element-plus项目基础搭建