博弈的三个要素

  • 参与者 player
  • 策略 strategy
  • 利益 payoffs

si    第i个参与者的策略
S     策略集合
Ui    第i个参与者选择策略si的利益

我们假设现在有两个参与者1和2,对于player1
我们说si'是si的劣势策略,当且仅当不管player2选择什么策略sj,U1(si,sj)>U1(si',sj)。
我们说si'是si的弱劣势策略,当且仅当不管player2选择什么策略sj,U1(si,sj)>=U1(si',sj)。

例子

大约在公元前三世纪,骑大象的汉尼拔将军想要侵略罗马,这里有两条路可以选择:一条路崎岖,需要翻越阿尔卑斯山;另一条平坦,只需沿着海岸线走。如果侵略者选择崎岖的路,仅翻越的过程中就会损失一个营的兵力;如果他碰到了你驻守的兵力,不管它走那条路,他都得再损失一个营的兵力。入侵者只能选择其中的一条路进行入侵,防御者只能选择一条路防御。我应该选择哪一条路进行防御。

  α β
α 2,0 0,2
β 0,1 1,1
这里假设α指崎岖的路,β指平坦的路。
其中左边的是我能够消灭的营的数量,右边的是汉尼拔将军能够保留的营的数量(假设他只有两个营,失去两个营他将会全军覆没)。
显然对于汉尼拔将军来说,策略β弱优于策略α,所以汉尼拔将军会选择策略β。
在汉尼拔将军选择β后,我选β能够得到较好的收益。
(事实上汉尼拔将军当时选择了翻越阿尔卑斯山。)

上一节课的题目
全班同学选择1到100之间的的一个数字,在不告诉别人的情况下,谁选的数字越接近平均数的三分之二,谁就获胜。你选的数字是什么?

第一次筛选:那些选择大于67的数会被淘汰,因为就算所有人都选择100,答案也是67又2/3。所以选择范围缩小到1到67。
第二次筛选:那些选择大于44的数会被淘汰,因为就算所有人都选择67,答案也是44又2/3。所以选择范围缩小到1到44。
第三次筛选:那些选择大于29的数会被淘汰,因为就算所有人都选择44,答案也是29又1/3。所以选择范围缩小到1到29。
。。。。。。
答案最终收敛为1。选择45到67的人觉得别人都很愚蠢。
所以这里涉及到一个“我知道你知道我知道你知道……”的过程。 -- 共同知识 common knowledge
所以如果大家都是理性的,那么最优策略就是1。但是最后统计得到的所有数的平均数是13又1/3,最接近他的2/3的数是是9,大于1。因为事实上并不是每个人都是理性的。

当我们再次进行一遍这次游戏的时候,所有人选择的数普遍都比之前要小了,因为大家都变得老练了。

因为不仅我们自己玩这个游戏玩的更好了,我们也了解到我们周围的人玩这个游戏玩的更好了。
对这个游戏的分析不仅让每个人都变得更老练了,也使你更了解别人老练的程度,并且你知道别人知道你知道如何玩到这个游戏。
从中我们得出一个重要结论:不仅你要站在别人的立场上思考别人的收益是怎么样的,你还要站在别人的立场上思考他们在博弈时有多老练,并且你还要考虑到他们认为你有多老练,还要考虑到他们认为你认为他们有多老练。

转载于:https://www.cnblogs.com/junealan/p/4331428.html

博弈论学习笔记(二)学会换位思考相关推荐

  1. qml学习笔记(二):可视化元素基类Item详解(上半场anchors等等)

    原博主博客地址:http://blog.csdn.net/qq21497936 本文章博客地址:http://blog.csdn.net/qq21497936/article/details/7851 ...

  2. [转载]dorado学习笔记(二)

    原文地址:dorado学习笔记(二)作者:傻掛 ·isFirst, isLast在什么情况下使用?在遍历dataset的时候会用到 ·dorado执行的顺序,首先由jsp发送请求,调用相关的ViewM ...

  3. PyTorch学习笔记(二)——回归

    PyTorch学习笔记(二)--回归 本文主要是用PyTorch来实现一个简单的回归任务. 编辑器:spyder 1.引入相应的包及生成伪数据 import torch import torch.nn ...

  4. tensorflow学习笔记二——建立一个简单的神经网络拟合二次函数

    tensorflow学习笔记二--建立一个简单的神经网络 2016-09-23 16:04 2973人阅读 评论(2) 收藏 举报  分类: tensorflow(4)  目录(?)[+] 本笔记目的 ...

  5. Scapy学习笔记二

    Scapy学习笔记二 Scapy Sniffer的用法: http://blog.csdn.net/qwertyupoiuytr/article/details/54670489 Scapy Snif ...

  6. Ethernet/IP 学习笔记二

    Ethernet/IP 学习笔记二 原文链接:http://wiki.mbalib.com/wiki/Ethernet/IP 1.通信模式 不同于源/目的通信模式,EtherNet/IP 采用生产/消 ...

  7. Java学习笔记二:数据类型

    Java学习笔记二:数据类型 1. 整型:没有小数部分,允许为负数,Java整型分4种:int short long byte 1.1 Int最为常用,一个Int类型变量在内存中占用4个字节,取值范围 ...

  8. 吴恩达《机器学习》学习笔记二——单变量线性回归

    吴恩达<机器学习>学习笔记二--单变量线性回归 一. 模型描述 二. 代价函数 1.代价函数和目标函数的引出 2.代价函数的理解(单变量) 3.代价函数的理解(两个参数) 三. 梯度下降- ...

  9. ASP.NET MVC 2 学习笔记二: 表单的灵活提交

    ASP.NET MVC 2 学习笔记二:  表单的灵活提交 前面说到有做到公司内部的一个请假系统,用的是ASP.NET MVC 2+Entity Framework.虽然EF(Entity Frame ...

  10. amazeui学习笔记二(进阶开发4)--JavaScript规范Rules

    amazeui学习笔记二(进阶开发4)--JavaScript规范Rules 一.总结 1.注释规范总原则: As short as possible(如无必要,勿增注释):尽量提高代码本身的清晰性. ...

最新文章

  1. 数据分析方法论2——流量分析
  2. winx官方站点改版了!
  3. Oracle SQL中实现indexOf和lastIndexOf功能
  4. iangularjs 模板_2018-web前端的自我介绍-优秀word范文 (5页)
  5. 【LeetCode笔记】剑指 Offer 44. 数字序列中某一位的数字(Java、偏数学)
  6. must override a superclass method
  7. linux服务器用户组和权限管,linux 用户管理,用户权限管理,用户组管理
  8. 米家扫地机器人是石头代工_扫地机器人“两强”突进,选科沃斯还是石头科技?...
  9. SoapUI接口测试——添加断言(检查点)——Assertion
  10. ​​​​​​​Carryon 数数字
  11. 算法竞赛进阶指南0x00基本算法 0x01位运算 例题起床困难综合征
  12. 抖音上热门精选技巧 小视频更改md5
  13. GPL授权GPL到底是什么?为什么MySQL可以收费?
  14. pixhawk编译环境搭建--2018.4.25
  15. html a标签设置背景,css利用A标签的背景可能作出很有意思的效果
  16. mc33063,mc34063发热问题
  17. 面向对象:余愿,知你冷暖,懂你悲欢,与你共黄昏,也能问你粥可温
  18. 睡眠多少分钟一个循环_你知道睡眠周期吗?
  19. Linux 常用服务搭建笔记(精简笔记)
  20. 200A FS3L200R10W3S7FB11 EasyPACK 950V IGBT模块

热门文章

  1. matlab cell数据转换
  2. Matlab有符号十六进制数据转换为有符号十进制数据并存储到txt文件
  3. 英文简历必备的关键词句
  4. SVN配置及简单操作(HM程序员课程最全笔记)
  5. 电脑上网卡顿解决小妙招
  6. 实现videojs接入m3u8视频,踩了多少坑啊
  7. C#获取get数据和post数据
  8. Flutter 动画转场欢迎屏 concentric_transition
  9. Positive Grid BIAS FX Desktop v2.4.4 Elite VR WiN 吉他效果器插件
  10. 电吉他效果器含拓展 – Native Instruments Guitar Rig 5.2.2 win-mac