博弈论简介

在上一篇文章中提到了计算广告内容众多,在这里将从机制设计开始谈起。所谓机制就是广告主与媒体方直接约定的一种规则,一种游戏的规则。广告产品在互联网公司里面往往属于商业部门,一般是公司的收益来源。商业涉及到经济,经济学相关原理是在计算广告,特别是机制设计的理论基础。

目前大部分在线广告是以拍卖的形式进行的,拍卖属于博弈论的范畴,博弈就是游戏,博弈论研究游戏的规则以及在规则下各方的反应和各个反应下产生的效果。博弈论为众多学科提供了分析的概念和方法:经济学和商学,政治科学,生物学, 心理学和哲学。博弈论与传统微观经济学相比较,两者在利益最大化和均衡原则上是一致的,微观经济学研究的市场更偏向于极端市场,即完全竞争市场或者垄断市场,这个市场的重要特点是市场的参与者决策不会影响到其他参与者的决策,这种情况下市场的运行主要通过『看不见的手』即供求关系调整并达到均衡。博弈论更加偏向研究在某种博弈规则下,博弈参与者之间的关系,研究博弈参与者之间的相互依存性和相互作用,就是研究博弈参与者根据策略地分析其他参与者可能的行为而做出理性的行为。

博弈分类与表示方法

博弈论研究参与者之间的相互关系,如果参与者之间是合作关系,那么称之为合作博弈,达成有约束力的协议(binding agreement),强调团体理性,强调效率、公正、公平。如果参与者之间不是合作关系,那么称之为非合作博弈,强调个人理性,其结果可能有效率,也可能无效率。

博弈的过程有动态和静态之分,静态博弈是参与者同时进行博弈或者可以看做同时选择策略的博弈,动态博弈是指参与者的选择和行动有先后顺序。按照参与者是否知道其他全部参与者的信息,又分为完全信息博弈和不完全信息博弈。

  • 完全信息静态博弈:囚徒博弈,智猪博弈、夫妻博弈、懦夫博弈
  • 完全信息动态博弈:海盗分金
  • 不完全信息静态博弈:求爱
  • 不完全信息动态博弈:黔之驴,李牧守关

对博弈论的建模方法(或者说表示方式)主要有两种:一种是策略型,一般用于分析静态博弈,常用表格的形式表示,包括博弈参与者的名单、博弈者参与者的策略集、博弈参与者的策略与其他参与者的策略组合时相对应的收益;另一种是展开型,一般用于分析动态博弈,常用博弈树的形式表示。当然,每一个展开型博弈可以表示成策略型,每一个策略型博弈至少有一种展开型表示。

完全信息静态博弈策略与结局

在博弈中,参与者的行动称之为策略,策略有好有坏,有优有劣。先引入两个概念:

  • 严格占优策略(强占优策略)
    对于一个参与者来说,无论其他参与者采取什么策略,这个策略的回报都严格大于执行其他策略所得到的回报。
  • 弱占优策
    对于一个参与者来说,无论其他参与者采取什么策略,这个策略的回报不小于执行其他策略所得到的回报。

对于博弈模型来说,占优策略是博弈的结局,也就是博弈的一个解。当所有参与者都有占优策略时,博弈存在占优策略解。在许多博弈中并不存在占优策略解,特别地,只要一个参与者没有占优策略,博弈没有占优策略解。

  • 累次剔除劣策略解

在许多博弈中,参与者不一定会有占优策略,除了搜寻占优策略,退而求其次,理性的人可能会去剔除不好的策略(劣策略),即无论别的参与者采取什么策略,剔除自己的策略集合中的劣策略(存在其他策略比该策略的回报大),获取策略子集,在子集上反复执行直到剩下最后一个解。在任何博弈中,如果能够求得这样唯一的累次剔除劣策略解,称之为IEDS解,称博弈是占优可解的。IEDS的解可能不唯一,强IEDS解是唯一的。这种解法的缺点是:存在占优可解的博弈,可能没有强IEDS解。
如果博弈中(N-1)个参与者有占优策略,那么该博弈必定有一个IEDS解。

  • 纳什均衡解(策略)
    纳什均衡是博弈的一种解(博弈可能还有占优解,IEDS解)。在给定其他参与者采取的策略时,该参与者回报最大的策略就是纳什均衡解,可以看出纳什均衡有两个条件,一个是对其他参与者采取的策略要猜测正确,另一个是每个参与者必须采用针对自己猜测的最优反应。纳什均衡是博弈论中最普遍的求解方法。
    关于纳什均衡解有三个问题
    (1)存在性:在一定的条件下的博弈,存在纳什均衡解【每个有限战略式博弈(参与人与战略数目均为有限)都有纳什均衡存在,这均衡有可能是混合战略均衡】
    (2)唯一性:在一些博弈中纳什均衡解不唯一
    (3)在多个纳什均衡解中,哪种均衡才是最合理的?

  • 混合策略
    之前讨论的都是纯策略,而混合策略是参与人在纯策略的基础上以一定概论进行的策略。一个混合策略可以优于最好的纯策略。存在没有纯策略纳什均衡的博弈,但是总存在混合策略的纳什均衡。

博弈三种解的关系

每一个占优策略解是一种IDES解,每一个IDES解是一种纳什均衡解,每一种纳什均衡解是一种混合策略均衡解,反之不成立。

对称博弈与对称均衡

对称博弈是参与人之间没有差异的博弈,每一个人都有相同的机会,相同的行动,并产生相同的收益,这就促成了对称均衡,每个参与者策略都相同的纳什均衡。

零和博弈

零和博弈是指两个博弈参与者,无论采用什么样的策略,他们的总盈利都是一个0(或者是一个常数)

不同博弈类型对应的均衡

  • 完全信息静态博弈:纳什均衡
  • 完全信息动态博弈:子博弈完美纳什均衡
  • 不完全信息静态博弈:贝叶斯纳什均衡
  • 不完全信息动态博弈:完美贝叶斯纳什均衡以及序贯均衡

参考资料:
《策略与博弈——理论与实践》,杜塔


欢迎关注微信公众号:AITBOOK

【广告算法工程师入门 9】机制设计-博弈论基础相关推荐

  1. 【广告算法工程师入门 20】机制设计-从GSP机制到VCG机制

    机制设计 在前文[广告算法工程师入门 9]机制设计-博弈论基础中已经谈过了微观经济学与博弈论的区别,在微观经济学中市场机制是一个『看不见的手』,调整市场进入均衡状态.在博弈论中,机制设计者(委托人)设 ...

  2. 【广告算法工程师入门 6】【转】20万、50万、100万的算法工程师,到底有什么区别?

    需要了解一下广告算法工程师之间的区别,推荐这篇文章. [转]@北冥乘海生 ,想吸收更多负能量,请大家关注公众号"计算广告"(Comp_Ad)和知乎专栏"计算广告" ...

  3. 【广告算法工程师入门 16】机制设计-最优拍卖机制设计

    最优拍卖机制 前文已经介绍到了,如果直接机制(P,M)是激励兼容的,则对所有的竞买人及真实估价vi,其预期支付只与分配规则相关,支付规则决定一个常数项. (注意这里不再要求对称性) 通常情况下售卖者是 ...

  4. 【广告算法工程师入门 13】机制设计-私人价值模型下四种拍卖形式的报价策略与均衡分析

    回顾 私人价值模型的五个假设:风险中兴,私有估价,独立性,对称型,理性. 四种拍卖形式:英式拍卖,荷兰式拍卖,第一价格密封拍卖,第二价格密封拍卖 从竞价策略上分析,荷兰式拍卖与第一价格密封拍卖存在等价 ...

  5. 【广告算法工程师入门 1】互联网广告的商业模式

    互联网广告的商业模式 一个公司生存需要有收益来源,互联网公司也不例外,其主要的收益来源有:广告,游戏,会员费等,最近的趋势是互联网公司的触角伸向各个领域,试图长足发展.至少从目前来看,搜索引擎公司谷歌 ...

  6. 【广告算法工程师入门 14】机制设计-带有保留价的拍卖与最优保留价

    带有保留价的拍卖 前文提到了售卖者即使在收益等价原理的情况下,还有一些选择来保证收益最大化,比较常见的措施是入场费,保留价等.保留价是售卖者设置的,当拍卖胜出者的最终支付价格小于该值时,售卖者有权要求 ...

  7. 【广告算法工程师入门 17】机制设计-有效机制与VCG机制

    有效机制 在前文中已经讨论过了,带有保留价的第二价格密封拍卖与最优机制均存在社会效率的损失,不是有效机制. 有效机制是指其分配规则可以最大化社会效率.当只有一个最高价值时,有效分配规则可以把物品分配给 ...

  8. 【广告算法工程师入门 32】从直播答题,跳一跳,抢红包等产品策略扯到用户受益商业变现

    最近吃瓜群众在游戏上微信小程序跳一跳和各类直播答题.玩完微信的跳一跳,然后在<冲顶大会>,<芝士超人>,<百万变现>跳一跳,生活变成了一场场撒钱狂欢,有些学霸们又显 ...

  9. 【广告算法工程师入门 5】百度搜索引擎变现策略指标体系

    百度搜索引擎变现策略指标体系 4 Replies 下文就百度商业变现的指标体系进行概要描述,并针对一个类似于百度LBS系统的变现思路,阐述一个商业系统变现策略指标体系的建立过程. 为什么需要商业变现策 ...

最新文章

  1. 标准SQL的update语句三种用法
  2. pojBuy Tickets2828线段树或者树状数组(队列中倒序插队)
  3. storm基础系列之二----zookeeper的作用
  4. 进程外Session保存和全局文件错误捕获
  5. C++ 内建函数对象
  6. [转载]压岁钱年年涨的行情不要太纠结
  7. request.getAttribute()和request.getParameter()两个方法的区别
  8. (5)Matplotlib_grid
  9. 阿里云云计算 14 使用阿里云中的OSS
  10. 在xp中运行 .air 文件--Adobe AIR Runtime for Window
  11. linux ubuntu安装svn,在Ubuntu下安装SVN工具RabbitVCS
  12. android 视频录制锐化,从录制到剪辑,用的同款APP,为什么你录制的游戏视频画面会远不如别人?...
  13. PCB封装-正片与负片
  14. 去大公司,还是小公司?我也曾犹豫彷徨……
  15. node.js之async的使用(series,whilst)
  16. App Store 审核指南 2017-12-13
  17. tl-wdr7300虚拟服务器怎么设置,TP-Link TL-WDR7300路由器wifi密码怎么设置?(电脑)...
  18. Vue完成的图片转换
  19. GORM CRUD 10 分钟快速上手
  20. Android开发:隐藏和显示底部导航栏

热门文章

  1. 使用react 高阶组件withRouter
  2. 恐惧症的根源一认知错误
  3. 如何利用API导出带有页眉页脚的excel
  4. java计算机毕业设计人事管理系统MyBatis+系统+LW文档+源码+调试部署
  5. IT战略规划做什么?
  6. 幼子嘟嘟谈美国文化系列5 美国文化的另一重要主线---体育(上)
  7. Wi-Fi 6为啥那么快?
  8. 枚举类型为什么是线程安全的?为什么反序列化枚举类型也不会创建新的实例?
  9. IOS Masonry介绍与使用实践:快速上手Autolayout
  10. Nginx--大型网站高并发处理