这几天看一些crowdsourcing的经典文章,发现经常初选game theory,之前看过一段时间但是没好好整理,重新整理一发

Non-cooperative Game

非合作博弈是指一种参与者不可能达成具有约束力的协议的博弈类型,这是一种具有互不相容味道的情形。非合作博弈研究人们在利益相互影响的局势中如何选决策使自己的收益最大,即策略选择问题。

负和博弈和零和博弈统称为非合作博弈,正和博弈亦称为合作博弈。

零和博弈

零和博弈是博弈论的一个概念,属非合作博弈,指参与博弈的双方,**在严格竞争下,一方的收益必然意味着另一方的损失,**博弈各方的收益和损失相加的总和永远为“零”。双方不存在合作的可能。零和博弈的结果是一方吃掉另一方,一方的所得正是另一方的所失,整个社会的利益并不会因此而增加一分。

当你看到两位对弈者时,你就可以说他们正在玩“零和游戏”。因为在大多数情况下,总会有一个赢,一个输,如果我们把获胜计算为得1分,而输棋为-1分,那么,这两人得分之和就是:1+(-1)=0。

这正是“零和游戏”的基本内容:游戏者有输有赢,一方所赢正是另一方所输,游戏的总成绩永远是零。

零和游戏原理之所以广受关注,主要是因为人们发现在社会的方方面面都能发现与“零和游戏”类似的局面,胜利者的光荣后面往往隐藏着失败者的辛酸和苦涩。从个人到国家,从政治到经济,似乎无不验证了世界正是一个巨大的“零和游戏”场。这种理论认为,世界是一个封闭的系统,财富、资源、机遇都是有限的,个别人、个别地区和个别国家财富的增加必然意味着对其他人、其他地区和国家的掠夺,这是一个“邪恶进化论”式的弱肉强食的世界。

但20世纪人类在经历了两次世界大战,经济的高速增长、科技进步、全球化以及日益严重的环境污染之后,“零和游戏”观念正逐渐被“双赢”观念所取代。人们开始认识到“利己”不一定要建立在“损人”的基础上。通过有效合作,皆大欢喜的结局是可能出现的。但从“零和游戏”走向“双赢”,要求各方要有真诚合作的精神和勇气,在合作中不要耍小聪明,不要总想占别人的小便宜,要遵守游戏规则,否则“双赢”的局面就不可能出现,最终吃亏的还是自己。

负和博弈

所谓负和博弈,是指双方冲突和斗争的结果,是所得小于所失,就是我们通常所说的其结果的总和为负数,也是一种两败俱伤的博弈,结果双方都有不同程度的损失。

Stackelberg game–主从博弈–mobile computing最常用模型

一方先行动,一方后行动的博弈也称为斯坦克伯格问题,也可称为主从博弈(leader and follower),与经典博弈模型相比,Stackelberg是一个动态的过程。即在经典博弈中的每一个参与人在博弈中地位是一致的,而主从博弈中的参与者的地位是不一致的,跟随者的策略选择依赖于领导者的策略选择。

Stackelberg game往往存在一个均衡的情况,这也是大部分模型想要达到或者计算的case,给一个最经典的例子

假定:某寡头市场上有两个厂商,他们生产相同的产品。

Nash均衡

纳什均衡定义
经济学定义[3]
所谓纳什均衡,指的是参与人的这样一种策略组合,在该策略组合上,任何参与人单独改变策略都不会得到好处。换句话说,如果在一个策略组合上,当所有其他人都不改变策略时,没有人会改变自己的策略,则该策略组合就是一个纳什均衡。

维基百科:
在博弈论中,纳什均衡(英语:Nash equilibrium,或称纳什均衡点)是指在包含两个或以上参与者的非合作博弈(Non-cooperative game)中,假设每个参与者都知道其他参与者的均衡策略的情况下,没有参与者可以透过改变自身策略使自身受益时的一个概念解。该术语以约翰·福布斯·纳什命名。在博弈论中,如果每个参与者都选择了自己的策略,并且没有玩家可以透过改变策略而其他参与者保持不变而获益,那么当前的策略选择的集合及其相应的结果构成了纳什均衡。即若 pi(s)=maxri[pi(s;ri)]{\displaystyle p_{i}(s)=max_{r_{i}}[p_{i}(s;r_{i})]}pi​(s)=maxri​​[pi​(s;ri​)],则称s为纳什均衡点,其中: pi{\displaystyle p_{i}}pi​ 为参与者i的收获(payoff),si{\displaystyle s_{i}}si​代表所有参与者之策略,ri{\displaystyle r_{i}}ri​代表参与者i的一种可能策略, (s;ri){\displaystyle (s;r_{i})}(s;ri​) 指参与者i单方面改变策略为 ri{\displaystyle r_{i}}ri​

即,纳什均衡的意思是:任何一方采取的策略都是对其余所有方采取策略组合下的最佳对策;当所有其他人都不改变策略时,为了让自己的收益最大,任何一方都不会(或者无法)改变自己的策略,这个时候的策略组合就是一个纳什均衡

纳什证明了在每个参与者都只有有限种策略选择、并允许混合策略的前提下,纳什均衡一定存在。以两家公司的价格大战为例,纳什均衡意味着两败俱伤的可能:在对方不改变价格的条件下,既不能提价,否则会进一步丧失市场;也不能降价,因为会出现赔本甩卖。于是两家公司可以改变原先的利益格局,通过谈判寻求新的利益评估分摊方案,也就是Nash均衡。类似的推理当然也可以用到选举,群体之间的利益冲突,潜在战争爆发前的僵局,议会中的法案争执等。

博弈论基础知识--非合作博弈,零和博弈,负和博弈,主从博弈,Nash均衡相关推荐

  1. 博弈论基础知识: 巴什博奕+斐波那契博弈+威佐夫博奕+尼姆博弈(及Staircase)

    博弈论基础知识: 巴什博奕+斐波那契博弈+威佐夫博奕+尼姆博弈(及Staircase) 转载自: http://tieba.baidu.com/p/1474319443 http://blog.sin ...

  2. Linux-dns基础知识和BIND的简单配置-3(主从DNS服务器及转发)

    rndc的相关知识: 1.什么是rndc: Remote Name Domain Controller,远程名称域控制器 rndc 通过一个 TCP 连接与名字服务器通信,发送经过数字签名认证的命令. ...

  3. 博弈论——非合作博弈 什么是纳什均衡

    博弈论--非合作博弈 纳什均衡用一句话来概括就是--博弈的所有参与人都为了满足自己 的个人利益而选择牺牲集体利益而导致的全体参与人都吃亏的均衡状态. 也可以粗略的理解为:要死大家一起死. 纳什均衡的本 ...

  4. 基于博弈论的大学生社群合作行为研究申报书(C写一个博弈软件)

    三科基金学生科研课题 立 项 申 报 书 课题名称:基于博弈论的大学生社群合作行为研究 学科分类:自然科学类 承担单位:温州大学网络工程本 负 责 人:Steve Jiang 需要整个C实现的博弈软件 ...

  5. 博弈论读书笔记(三):负和、零和、正和博弈

    博弈论读书笔记 三.负和.零和.正和博弈 博弈从结果上来说可以分为负和博弈.零和博弈.正和博弈三种基本类型,这也是最常规的一种划分方式. 负和博弈是指双方在博弈中由于存在不可协调的冲突和矛盾,或者双方 ...

  6. MATLAB代码:基于非合作博弈的多微网P2P交易策略研究

    MATLAB代码:基于非合作博弈的多微网P2P交易策略研究 关键词:微网 P2P交易 非合作博弈 交易电价 参考文档:<基于博弈论的多微电网系统交易模式研究>完全复现 仿真平台:MATLA ...

  7. 多智能体强化学习入门(一)——基础知识与博弈

    作者:ECKai(强化学习,多智能体强化学习) 文章仅作为学术交流,著作权归属作者,侵删 一.引言 在多智能体系统中,每个智能体通过与环境进行交互获取奖励值(reward)来学习改善自己的策略,从而获 ...

  8. [复杂网络博弈] 第一章 博弈论基础

    第一章 博弈论基础 1. 博弈基础 1.1 博弈的表示形式 1.2 纯策略与混合策略 2. 博弈解 2.1 占优策略均衡 2.2 纳什均衡 3. 博弈学习动力学简介 3.1 博弈学习框架 3.2 最优 ...

  9. 非财务人员的财务培训教(一.二)------财务基础知识

    二 . 基本财务管理知识 第一节 财务管理基础知识(一) 财务与会计的关系 会计的基础知识 ( 一 ) 财务与会计的关系 财务与会计的内涵 1.会计 会计工作主要是解决三个环节的问题: 会计凭证 会计 ...

  10. 正常性入职岗前培训(非培训机构的实习生入职培训)---基础知识总结

    一:正常性大三实习生入职岗前培训总结: 也许题目应该叫"那个矫情的大三实习生已经入职实习了": 之前那个矫情的大三生写的找工作的感受(上次是偏理论性,这次是实践性出来找工作): 一 ...

最新文章

  1. java 最小化 api_Java的API设计实践
  2. AI企业下一个使命:让生物特征数据使用走向阳光透明
  3. 为什么我那么努力,模电还是学不懂?
  4. Asp.NET Core一个接口的多个实现如何基于当前HTTP请求注册
  5. mysql 用户管理表_mysql用户管理
  6. java类装载器原理
  7. 零元学Expression Blend 4 - Chapter 9 用实例了解布局容器系列-「Canvas」
  8. python实现Longest Common Subsequence最长公共子序列算法
  9. 身份证阅读器在国产操作系统Linux内核中的二次开发
  10. 堪萨斯州立大学计算机科学,堪萨斯州立大学有哪些专业?
  11. Redis持久化(RDB/AOF)【西橙先生】
  12. [OCCT] OCC官方示例介绍
  13. 软考中高级项目管理案例分析-进度管理
  14. App自动化测试怎么做?实战分享App自动化测试全流程
  15. Python中文分词库——jieba的用法
  16. 我要搬家到51CTO了.
  17. RK平台之AI组件例程使用说明
  18. 使用elementUI中的date-picker组件年月日显示英文
  19. 日语标点符号用法解说!
  20. Redis数据库常用操作命令(查询db、key、value)

热门文章

  1. 协作中继认知无线电功率分配
  2. 计算机蓝屏代码0x0000007A,电脑开机蓝屏代码0x0000007a怎么办
  3. Android签名总结
  4. 国内博客(blog)搬家工具(服务)大全
  5. Centos 部署OpenVP* 证书+密码认证
  6. oracle讲表通过主键去重,数据库试题,数据库基础试题及答案
  7. 计算机二级公共基础知识资料(考点集合)
  8. 【Android】ListView 控件的简单使用
  9. NERO8.3.6.0(官方完整版+序列号)
  10. 收集的一些discuz插件常用插件分享给大家了