1 序贯博弈与重复博弈

1.1 序贯博弈(sequential game)

参与人在前一个决策点的选择决定随后的子博弈的结构。因此, 从后一个决策点开始的子博弈不同于从前一个决策点开始的子博弈。或者说,同样结构的子博弈只出现一次。

1.2 重复博弈(repeated game)

同样结构的博弈重复多次,其中的每次博弈被称为“阶段博弈” (stage game)。(重复博弈中的每一个子博弈:阶段博弈)

1.2.1 重复博弈的特点

->阶段博弈之间没有物理上的联系(前一段博弈的结果不影响后一阶段博弈的结构)

->每一个参与人都可以观察到博弈过去的历史

->每个参与者最后得到的报酬=各个阶段博弈支付的贴现值之和

如果博弈不是一次的,而是重复进行的,参与人过去行动的历史是可以观察到的,参与人就可以将自己的选择依赖于其他人之前的行动。--->因而有了更多的战略可以选择,均衡结果可能与一次博弈大不相同。

重复博弈理论的最大贡献是对人们之间的合作行为提供了理性解释。在囚徒困境中,一次博弈的唯一均衡是不合作(即坦白)。但如果博弈无限重复,合作就可能出现。

2 战略空间

2.1 不依赖于过去行动历史的战略

·永远背叛战略:All-D——永远不合作

·永远合作战略:All-C——永远合作

2.2 依赖于过去行动历史的战略

2.2.1 针锋相对战略(tit-for-tat)

第一次采取合作,之后每一次的行动都建立在对手前一次行动的基础上。

如果你今天不和我合作,我明天也不和你合作;如果你今天和我合作了,那我明天也和你合作。

2.2.2 触发战略/冷酷战略(trigger strategies)

第一次采取合作

之后只要没有不合作,就一直合作下去;一旦有一次不合作,之后就都不合作。

3 合作的假值和耐心

本节需要用到的囚徒困境模型

同时就像 博弈论笔记1:囚徒困境与纳什均衡_刘文巾的博客-CSDN博客_博弈说的那样,R>T>P>S; (S+R)<T+T

我们引入贴现因子β(明天的一块钱=今天的β块钱)【β越大——越耐心,越重视未来】

维持长期合作的话,每个人的收益为, 从这里也能看出,β越大,也就是越耐心,长期合作的收益越大,也就越会合作。

当然,未来利益对人的重要程度还和很多因素有关:

->年龄:“59岁现象”(60岁退休的人,在他59岁的时候,可能会选择更加重视眼前利益的策略)

->家庭:有家庭的人更重视未来的收益

->宗教:因果轮回

4 无名氏定理

在一个无限期的重复博弈中,如果每个参与人对未来都足够重视(β足够大),那么任何程度的合作都可以作为一种精炼纳什均衡来出现(任何程度——整个博弈中合作的概率)。

5 合作与惩罚

5.1 针锋相对

如果双方都坚持针锋相对战略:

1)首次都选择合作,之后也都合作,双方的收益都是

2)如果对方针锋相对,一方总不合作

那么只有第一轮合作,第二轮开始都不合作。

双方的收益为:

只合作一次的那一方:S+Pβ/(1-β)

一直不合作的那一方R+Pβ/(1-β)

什么时候会合作呢?

合作的收益大于不合作的收益 ,即 

合作的好处越大(T越大)/不合作和好处越小(P越小)/单方不合作的收益越小(R越小)

——β的范围越大,合作的可能性越大

5.2 行为的信息传递

假如我不合作两次,才会被发现我的行为。此时的收益为:

此时的合作条件:

经过化简,得到:

通过这个,我们可以得到结论:欺骗行为越晚被发现(越难被发现),欺骗发生的可能性就越大。合作就越困难。

5.3  针锋相对战略是一种纳什均衡,但不是一种精炼纳什均衡

t+1时刻,A知道B会合作,所以自己就不会不合作,反而会合作

——所以针锋相对就不是一个精炼纳什均衡

6 多重关系对于合作的影响

多重交易关系会对人们博弈中的行为产生 重要影响,使得人们之间更容易达成合作。

建立更多关系以达成合作

多重交易问题产生的惩罚的不可信问题:由于惩罚方和被惩罚方有关系,所以惩罚不仅惩罚了被惩罚者,惩罚者本人也在一定程度上被惩罚了

假设两人使用针锋相对战略,那么:

在交易关系1中,合作条件是 

在交易关系2中,合作条件是

如果这种交易在同样的两个人之间进行,即这两个人同时进行这两种交易,那么此时的交易关系矩阵变为:

  合作 不合作
合作 (3+5,3+5)=(8,8) (-1+0,4+9)=(-1,13)
不合作 (4+9,-1+0)=(13,-1) (0+4,0+4)=(4,4)

此时的合作关系为

如果本来的β为0.6 那么如果两个交易分开进行的话,只会进行交易1。如果交易1和交易2同时进行,那么此时在这个β的条件下,交易和交易2 都可以进行。

市场交易常常镶嵌在复杂的社会关系中。这种关系可以提高交易的合作程度。这也是人们愿意发展社会关系的原因。(家庭血缘关系、朋友关系、同学关系、老乡关系。。。)

6.1 杀熟困境

       如果惩罚对惩罚者本身的损害太大,惩罚就是不可信的。
       这与投鼠忌器是一个道理,你讨厌老鼠,但是你没有办法,因为你心疼那个盘子,那个器皿。投鼠忌器在企业内部很多环节都会发生,导致惩罚不可信,所以对方就不会太注重信誉。家族成员有时候比非家族成员更不可信任,更不守规矩,就是这个道理。
        朋友专门骗朋友,是“杀熟”。问题也与惩罚的不可信有关。

6.2 第三方实施惩罚

       前面假定了固定的一对参与人进行重复博弈, 对不合作的惩罚是由“受害人”本人实施的, 称为“second-party enforcement”,或者 “personal enforcement”。
        但更经常的情况是参与人不固定的情况。此时, 惩罚要由第三方实施(third-party enforcement)。

6.2.1 集体抵制

      规则: 每个人都应该诚实,都有责任惩罚骗过人的人;不参与惩罚的人应该受 到惩罚。
      如:假定B在t期欺骗了A ,C在t+1期就不应该与B合作。否则,D在t+2 期就不应该与C合作; 
             如果C在t+1期与B合作,而D在t+2期又与C合作,E在t+3期就不应该与D合作,如此等等;
敌友规则:开始把所有的人当朋友;t期的朋友关系继续保持到t+1期,当只当他在t期不曾骗过任何人并不曾与你的敌人合作,t+1期才继续是朋友。

博弈论笔记:重复博弈相关推荐

  1. 人工智能笔记之专业选修课4.1.5 - 博弈论 9.重复博弈,效用,随机博弈

    重复博弈 (repeated games) 当我们考虑世界上绝大部分互动时,其中很多不止会发生一次 市场上的公司 它们与竞争对手活动 朋友,你会交换吗,你会在朋友需要帮助时帮助他们吗?你需要时他们会帮 ...

  2. 博弈论——重复博弈和制度建设

    1 重复博弈 重复博弈是指同样结构的博弈重复许多次,其中的每次博弈称为"阶段博弈"(stage games).重复博弈是动态博弈中的重要内容,它可以是完全信息的重复博弈,也可以是不 ...

  3. 博弈论与信息经济学-重复博弈

    序贯博弈 下一结与上一结不同 重复博弈 各阶段博弈相同 阶段博弈没有物质间联系 所有参与人都能观测到博弈过去的历史 参与人的总支付是所有阶段博弈支付的贴现值之和或加权平均值. (1)不能作为子博弈精炼 ...

  4. 首都师范 博弈论 6 5 1有限次的重复博弈

    6 5 1有限次的重复博弈

  5. 首都师范 博弈论 6 5 5无限次重复博弈中的策略选择

    6 5 5无限次重复博弈中的策略选择

  6. 首都师范 博弈论 6 5 3无限次重复博弈中达成合作的条件

    6 5 3无限次重复博弈中达成合作的条件

  7. 耶鲁大学《博弈论》课程——重复博弈

    重复博弈 Repeated Games 日常生活中的大部分互动,是根本没有契约的,但是很多关系都有重复性,比如朋友之间的友谊.国与国之间的互动等都不需要契约来制衡,但是通常情况下,他们之间的合作是持久 ...

  8. 计算机模拟 博弈 善意,从两本奇书看人与人的重复博弈

    人,作为生活在社会里的一个个体,怎么样的社交风格最容易成功?怎么样的社交风格又最容易遭遇失败? 这两年有一本叫做<give and take>的书非常火,作者是沃顿商学院的管理学教授亚当· ...

  9. 重复博弈reapted games

    Reapted Games 之前学的基础模型几乎都是静态的(同时决策),除了斯坦伯格模型稍微带了点动态(领导者带领着跟随者) 重复博弈有以下特点: 1.和同一个人重复进行交互 2.动态的持续的 例子: ...

  10. 博弈论——非合作博弈 什么是纳什均衡

    博弈论--非合作博弈 纳什均衡用一句话来概括就是--博弈的所有参与人都为了满足自己 的个人利益而选择牺牲集体利益而导致的全体参与人都吃亏的均衡状态. 也可以粗略的理解为:要死大家一起死. 纳什均衡的本 ...

最新文章

  1. Step-By-Step在AIX上安装Oracle RAC
  2. GAE上使用Struts2
  3. 【408预推免复习】计算机网络(谢希仁第七版)第二章——物理层
  4. intelliJ idea 下载安装
  5. ASP.NET站点导航(五)
  6. asterisk 互联
  7. 学前端开发是一种什么样的体验?
  8. 手机 html5 hammer drag widget,javascript – HTML5使用Hammer.js拖放事件拖放div上的元素
  9. JAVA数据类型的强制转换
  10. 2019-2020 中国集成电路产业人才白皮书
  11. Python基础:while循环 以及 练习题 :三位数的水仙花数 GDP 计算π 判断一个数是否是素数
  12. 以太网交换机的工作原理
  13. 超级干货:手把手教你如何实现数据可视化
  14. Arduino UNO驱动DS1307数字实时时钟RTC
  15. Effective Java 2.0_中英文对照_Item 7
  16. github的crx快速下载
  17. hadoop -appendToFlie unknown command
  18. 问道手游《新手怎么玩转押镖流》
  19. 送女友的html语言,html+css+js精美页面,送女友
  20. C语言之单引号和双引号

热门文章

  1. elasticsearch 匹配发音相同单词的方案
  2. Eclipse中安装ADT插件
  3. CSDN账号被盗了吗?
  4. Excel数据透视表经典教程九《数据透视表计算》
  5. windows服务器虚拟机 全屏,虚拟机安装Windowsxp系统后无法全屏的解决方法
  6. JavaScript 获取网络时间(非本机时间)
  7. oracle10g下载与安装教程,Oracle10g安装图解与Oracle10g卸载教程
  8. 高性能mysql 3 pdf下载_《高性能MySQL_第3版》PDF版本下载
  9. 如何拦截Windows键而不屏蔽它参与的组合键(如win+d等)
  10. 汇编语言程序设计-钱晓捷(第五版)第三章-汇编语言程序格式