耶鲁博弈论 第2节 学会换位思考

一些定义

形成博弈的要素

  • 参与人(players),用 iii, jjj 表示
  • 参与人的策略(strategies),用 sis_{i}si​,sjs_{j}sj​ 表示;
    所有可能的策略集合 SiS_{i}Si​,区别于参与人的策略小写 sss;
    某一次博弈 sss,用不带下标的 sss 表示,称为策略组合(a strategy profile),也称为策略向量
  • 博弈的收益(payoffs),用大写的 UUU 表示,UiU_{i}Ui​ 取决于参与博弈的 NNN 个人的博弈策略,记做 (s1,...,si,...,si)(s_{1},...,s_{i},...,s_{i})(s1​,...,si​,...,si​),简写为 Ui(s)U_{i}(s)Ui​(s),由策略组合决定(即所有参与博弈的人)

我们用 s−is_{-i}s−i​ 表示除了 iii 之外的其他参与者的决策,因为考虑在和对手在不同选择下的收益是很有必要的,填数游戏中以标准形式描述博弈:

Ui(s)={5美元−误差0U_{i}(s)= \begin{cases} 5美元 - 误差 \\ 0 \end{cases} Ui​(s)={5美元−误差0​

再用一个例子熟悉使用符号语言来描述博弈:

5, -1 11, 3 0, 0
6, 4 0, 2 2, 0

这里参与人是 AAA 和 BBB
策略集合是 S1={上,下}S_{1}=\{上,下\}S1​={上,下},S2={左,中,右}S_{2}=\{左,中,右\}S2​={左,中,右}
收益:例如 U1(上,中)=11U_{1}(上,中)=11U1​(上,中)=11,U2(下,右)=0U_{2}(下,右)=0U2​(下,右)=0
显然对于参与者 BBB,右是严格劣势策略。因此我们给出 严格优势策略的定义:

参与人i的策略si′严格劣于参与人i的另一个策略si,在其他参与者选择s−i时,选择si的收益Ui(si)严格优于此情况下si′的收益Ui(si′)\begin{aligned} 参与人 i 的策略 s_{i}^{'} 严格劣于参与人 i 的另一个策略 s_{i},在其他参与者\\ 选择 s_{-i} 时,选择 s_{i} 的收益 U_{i}(s_{i}) 严格优于此情况下 s_{i}^{'} 的收益 U_{i}(s_{i}^{'}) \end{aligned} 参与人i的策略si′​严格劣于参与人i的另一个策略si​,在其他参与者选择s−i​时,选择si​的收益Ui​(si​)严格优于此情况下si′​的收益Ui​(si′​)​

再来一个例子:

汉尼拔将军将要攻打一个国家,他有两个营的兵力,他可以选择从崎岖道路(翻过阿尔卑斯山)进军(但是行军途中要损失一个营的兵力),也可以选择从平坦的道路(平原)进军(途中没有损失)。防守者只能在崎岖道路和平坦道路其中之一设防,当进攻者遇到防守者时,进攻者将损失一个营的兵力。若你是防守者,你该选择何处设防?

双方收益如下:(行是防守者,列是进攻者)

easy hard
easy 1, 1 1, 1
hard 0, 2 2, 0

在这个例子中,防守者似乎没有严格优势策略,但是对于汉尼拔将军(进攻方)来说,选择平坦道路进攻似乎优于从崎岖道路进攻,这只是一个优势策略,并非严格优势,只是一个弱优势。我们引出 弱优势 的定义:

参与人i的策略si′弱于参与人i的另一个策略si,在其他参与者选择s−i时,选择si的收益Ui(si)大于等于此情况下si′的收益Ui(si′),即Ui(si,s−i)≥Ui(si′,s−i)foralls−iUi(si,s−i)>Ui(si′,s−i)forsomes−i\begin{aligned} \begin{array}{c} 参与人 i 的策略 s_{i}^{'} 弱于参与人 i 的另一个策略 s_{i},在其他参与者\\ 选择 s_{-i} 时,选择 s_{i} 的收益 U_{i}(s_{i}) 大于等于此情况下 s_{i}^{'} 的收益 U_{i}(s_{i}^{'}),即\\ U_{i}(s_{i},s_{-i}) \geq U_{i}(s_{i}^{'},s_{-i})\ for\ all\ s_{-i} \\ U_{i}(s_{i},s_{-i}) > U_{i}(s_{i}^{'},s_{-i})\ for\ some\ s_{-i} \end{array} \end{aligned} 参与人i的策略si′​弱于参与人i的另一个策略si​,在其他参与者选择s−i​时,选择si​的收益Ui​(si​)大于等于此情况下si′​的收益Ui​(si′​),即Ui​(si​,s−i​)≥Ui​(si′​,s−i​) for all s−i​Ui​(si​,s−i​)>Ui​(si′​,s−i​) for some s−i​​​

回到填数游戏

好,那么我们现在回到第一节课的填数游戏,在 1−1001-1001−100 之间任选一个数,最接近平均数的 23\frac{2}{3}32​ 的人获胜。

老师询问了填 33−3533-3533−35 之间的数的同学,他们回答:大家在 1−1001-1001−100 之间随机选择一个数,最后平均值会在 505050 左右,而 505050 的三分之二就是 333333 左右。

这个说法看似正确,但是却忽略了一个重要前提:教室里的人并不会随机选择一个数,他们都想赢得这5美元。若人人都这样想,最终平均值会趋近于 333333,而 333333 的三分之二是 222222。然而,这还是太大了。

再次重申这个游戏的重点:每个人都有自己的策略,每个人都想赢。

那么我们来分析一下这个游戏,哪些选择是(弱)劣势策略?

设想最坏的情况,每个人都选了 100100100 那么这样最终的结果也只是 662366\frac{2}{3}6632​ 最接近的是 676767,那么选择大于 676767 的数相对于 676767 来说就是弱劣势策略。这样对于理智的人来说,游戏简化成了在 1−671-671−67 之间选择一个数,因为他们知道没人会选择 676767 以上的数。
同样,相似的策略也会被排除,这样,454545 以上的数也不会有人选。但是 45−6745-6745−67 之间的数在原博弈中并不是弱劣势策略,可是我们排除掉 67−10067-10067−100 的时候,45−6745-6745−67 便成为了弱劣势策略。同理,30−4530-4530−45 也被排除,20−3020-3020−30,14−2014-2014−20…直至 111.

尽管 111 就是这个游戏的最优策略,但是这一切都是建立在参与人都是理性的情况下,并且理性的参与者知道其他人也都是理性的。我们用术语共同知识来描述类似:我知道,我知道你知道,我知道你知道我知道…这样的循环。但是实际上,每个区间的数都有人选择,这就要考虑分布的问题了。最终老师公布结果,平均数在 131313 左右,最终选择 999 的人获得了胜利,巧的是,这也是所有人选择的中位数。

按照之前的最优策略,为什么 111 不是最终结果呢?尽管有相当一部分人选择了 111,

耶鲁博弈论 第2节 学会换位思考相关推荐

  1. IT职业教育(10)教育要先学会换位思考

    以前开过一个培训学校,有天突然接到一个学生家长的电话,说:"马老师,您在吧,我现在过去和您聊聊." "您是?"我有些差异,成人学习中直接面对家长的次数并不是很多 ...

  2. 博弈论学习笔记(二)学会换位思考

    博弈的三个要素 参与者 player 策略 strategy 利益 payoffs si    第i个参与者的策略 S     策略集合 Ui    第i个参与者选择策略si的利益 我们假设现在有两个 ...

  3. 博弈论2:学会换位思考(弱劣势策略)

    在引入弱劣势策略之前先定义如下符号: si:某个人的决策 Si:所有人的策略集{s1,s2,...,sn} s:某一次博弈 一次博弈成为策略组合 收益:U(s1,....,sn) S-i:除了i以外其 ...

  4. 耶鲁博弈论公开课笔记

    这两周我看完了耶鲁大学的博弈论公开课,收获非常大,系统地了解了博弈论中的主要概念和方法,主要包括以下内容: 1. 首先是了解了很多的博弈模型,包括同步博弈中的古诺模型.伯川德模型.候选人-选民模型.谢 ...

  5. 耶鲁大学 博弈论(Game Theory) 笔记2-学会换位思考

    学会换位思考 学会换位思考 如何形成博弈 博弈组成要素 严格优势策略 选数游戏 共同知识与相互知识 如何形成博弈 博弈组成要素 参与者 i , j i,j i,j 策略 s i , s j s_i,s ...

  6. 博弈论(Game Theory)

    博弈论是研究策略形式 策略形式:行为影响结果,结果不仅取决于你的行为,还取决于其他人的行为 应用于经济学(Economics),政治学(Politics),法学(Law),生物学(Biology),体 ...

  7. 行走职场,撞得头破血流才明白的10个道理,学会自己抬举自己

    你进入职场多年,有哪些头撞南墙后豁然开朗的道理?我懂这么多道理,仍然过不好一生.这是正常的,有些道理,不是用来让你获取利益的,而是让你减轻烦恼,甚至是解脱的,并没有让你迅速成功的功效.行走职场五年,撞 ...

  8. 博弈论——浙江大学蒋文华笔记

    博弈论--浙江大学蒋文华笔记 什么是博弈? 博弈的定义 什么是博弈? 博:总览全局 弈:对弈棋局 谋定而动 博弈的定义 博弈是指在一定游戏规则的约束下,基于直接相互作用的环境条件,各参与人依据所掌握的 ...

  9. MOOC-浙江大学-博弈论基础-学习笔记(一)

    MOOC-浙江大学-博弈论基础-学习笔记(一) 老师:蒋文华 知人者智,自知者明: 胜人者力,自胜者强: 小胜者术,大胜者德. 第一讲 概论 1.何为博弈? 博-博览全局, 奕-对弈棋局, 谋定而动! ...

  10. 做产品:光有换位思考还不够

    经常听到产品经理的必备能力之一就是要学会换位思考,如果你是用户,你应该有什么样的体验.这句话说得没错,逻辑上非常正确.但是要真正做起来,很难. 在实践中,仅仅是换位思考,对于产品经理来说,还远远不够. ...

最新文章

  1. 2022-2028年中国网络出版产业投资分析及前景预测报告
  2. C#编译器选项(目标平台)
  3. SAS,SATA普及文档
  4. 使用FTP下载文件connect.retrieveFileStream(filename) 获取不到InputStream流,返回null的问题
  5. 扩展图形输出 1111 java
  6. 电脑问题勘查 —— BIOS
  7. zynq开发系列6:创建AXI IP实现PS对PL的数据配置(步骤二配置block design)
  8. android启用hdcp_如何在Android的Google键盘中启用单手模式
  9. php5市场占有率,javascript,php_目前国内浏览器的市场占有率?,javascript,php,html,html5,css - phpStudy...
  10. 增长黑客读书笔记(一)搭建增长团队
  11. java id pid 递归,父子结构数据(id,pid)递归查询所有子id合集和父id合集
  12. vue动态生成二维码,扫码登录
  13. 高考真的能改变命运吗?
  14. Java导出Excel解决乱码及导出文件打开不可读需修复的问题
  15. virtualenv: error: argument dest: the destination . is not write-able at /User/de/ .virtualenvs解决方法
  16. 走进“开源SDR实验室” 一起玩转GNU Radio:AGC自动增益控制
  17. ECNU计科复试机试(2019)
  18. 超详细拆机攻略之联想IdeaPad310S-14ISK
  19. layui loading动画_javascript制作loading动画效果 loading效果
  20. 云桌面与PC之间,优先选谁?

热门文章

  1. 分享PMP真题回忆,出征软考高级项目管理师
  2. 距7月30日PMP考试不足10天,应该做点什么?
  3. DevExpress WinForms v21.1 - 富文本编辑器、PDF Viewer全新升级
  4. 用JAVA写一个视频播放器
  5. android 新浪微博客户端的表情功能的实现,flutter教程pdf
  6. 游戏策划小白笔记——Common Sense(二)
  7. Omnipeek 抓包工具
  8. vb改变字形的代码是什么_VB里什么代码可以把文本框中的字改成斜体
  9. 夜间灯光数据dn值_一种基于NDBI的城市夜间灯光数据去饱和方法与流程
  10. 小程序源码:多功能图片处理器-多玩法安装简单