文章目录

  • 简介
  • 定义
  • 性质
  • 举例1:手套博弈
  • 举例2

简介

沙普利值是合作博弈理论中的一个概念,由劳埃德-沙普利在1951年提出了这个概念,并因此在2012年获得了诺贝尔经济学奖。对于每个合作博弈,它为所有玩家的联盟产生的总盈余分配了一个独特的分配。沙普利值的特点是有一系列的理想属性。

其设置如下:一个玩家联盟进行合作,并从合作中获得一定的整体收益。由于一些玩家对联盟的贡献可能大于其他玩家,或者可能拥有不同的讨价还价能力(例如威胁要破坏整个盈余),在任何特定的游戏中,所产生的盈余在玩家之间的最终分配应该是什么?或者换个说法:每个参与者对整个合作有多重要,他或她可以合理地期待什么回报?沙普利值为这个问题提供了一个可能的答案。

定义

从形式上看,一个联盟博弈的定义是:有一个集合N(n个玩家)和一个函数v,将玩家的子集映射到实数:v:2n→R,v(∅)=0v:2^n\rightarrow R,v(\varnothing)=0v:2n→R,v(∅)=0。其中∅\varnothing∅表示空集。函数v被称为特征函数。

函数v的含义如下:如果S是一个玩家联盟,那么v(S)称为联盟S的价值,表示S的成员通过合作可以获得的总的预期报酬总和。

Shapley值是将总收益分配给参与者的一种方式,假设他们都进行合作。它是一种 "公平 "的分配,因为它是唯一具有以下某些理想特性的分配。根据沙普利值,在给定的联盟博弈(v,N)中,玩家i得到的金额是
φi(v)=∑S⊆N/{i}∣S∣!(n−∣S∣−1)!n!(v(S∪{i})−v(S))=∑S⊆N/{i}(n1,∣S∣,n−∣S∣−1)−1(v(S∪{i})−v(S))\varphi_i(v) = \sum_{S \subseteq N/\{i\}}\frac{|S|!(n-|S|-1)!}{n!}(v(S\cup \{i\})-v(S)) \\ =\sum_{S \subseteq N/\{i\}}\left( \begin{array}{cc} n \\ 1,|S|,n-|S|-1\end{array} \right)^{-1}(v(S\cup \{i\})-v(S)) φi​(v)=S⊆N/{i}∑​n!∣S∣!(n−∣S∣−1)!​(v(S∪{i})−v(S))=S⊆N/{i}∑​(n1,∣S∣,n−∣S∣−1​)−1(v(S∪{i})−v(S))

其中n是玩家总数,总和扩展到不包含玩家i的N的所有子集S上。该公式可以解释如下:设想联盟是由多个玩家组成的,每个玩家要求他们的贡献v(S∪{i})−v(S)v(S\cup \{i\})-v(S)v(S∪{i})−v(S)作为公平补偿。对每个玩家来说,在可能形成联盟的不同排列组合中取这个贡献的平均值。

沙普利值的等价公式是
φi(v)=1n!∑R[v(PiR∪{i})−v(PiR)]\varphi _i(v) = \frac{1}{n!}\sum_{R}[v(P_i^R \cup \{i\})-v(P_i^R)]\\ φi​(v)=n!1​R∑​[v(PiR​∪{i})−v(PiR​)]
所有玩家的排列R的总数为n!,PiRP_i^RPiR​是R中第i个玩家之前的排序。

性质

  • 有效性 efficiency

    所有玩家沙普利值的总和等于联盟的价值,所以所有收益都在参与玩家之间分配。
    ∑i∈Nφi(v)=v(N)proof:∑i∈Nφi(v)=1∣N∣!∑R∑i∈Nv(PiR∪{i})−v(PiR)=1∣N∣!∑Rv(N)=1∣N∣!∣N∣!⋅v(N)=v(N)\sum_{i \in N}\varphi _i(v) = v(N)\\ proof:\sum_{i \in N}\varphi _i(v) =\frac{1}{|N|!}\sum_R \sum_{i \in N} v(P_i^R \cup \{i\})-v(P_i^R)\\ =\frac{1}{|N|!}\sum_R v(N)= \frac{1}{|N|!}|N|!·v(N) = v(N) i∈N∑​φi​(v)=v(N)proof:i∈N∑​φi​(v)=∣N∣!1​R∑​i∈N∑​v(PiR​∪{i})−v(PiR​)=∣N∣!1​R∑​v(N)=∣N∣!1​∣N∣!⋅v(N)=v(N)

  • 对称性 symmetry

    如果i和j是两个平等的玩家,那么v(S∪{i})=v(S∪{j})v(S \cup \{i\}) = v(S\cup \{j\})v(S∪{i})=v(S∪{j}),对N中包含i或j的任意子集S,都有φi(v)=φj(v)\varphi_i(v) = \varphi_j(v)φi​(v)=φj​(v),这一性质也被叫做同等条件下的平等待遇。

  • 线性性 linearity

    如果两个收益函数v和w确定的两个联邦博弈结合起来,那么收益分配应当与它们单独的收益相对应。
    φi(v+w)=φi(v)+φi(w)φi(av)=aφi(v)\varphi_i(v+w) = \varphi_i(v)+\varphi_i(w)\\ \varphi_i(av) = a\varphi_i(v) φi​(v+w)=φi​(v)+φi​(w)φi​(av)=aφi​(v)

  • Null player

    没有玩家的博弈v的沙普利值为0。给定结合N,沙普利值是唯一从博弈集合到支付向量的映射,满足有效性、对称性、线性性、空玩家。

  • 匿名性 anonymity

    如果i和j是两个玩家,w是一个获得函数,除了i和j被交换以外,w和v等同,所以φi(v)=φj(w)\varphi_i(v) = \varphi_j(w)φi​(v)=φj​(w)。这意味着玩家的标签在分配它们的收益时不起作用。

  • 边际性 marginalism

    沙普利值被看作只使用玩家i的边际贡献率为参数的函数。

举例1:手套博弈

玩家1和2各有一只右手手套,玩家3有一只左手手套,联盟博弈的价值函数是
KaTeX parse error: Undefined control sequence: \mbox at position 39: …rray}{rcl} 1 & \̲m̲b̲o̲x̲{if} \quad S\in…

找出所有排列3!,玩家1的边际贡献率如下表

Order R MC1
1,2,3 v({1})−v(∅)=0v(\{1\})-v(\varnothing) = 0v({1})−v(∅)=0
1,3,2 v({1})−v(∅)=0v(\{1\})-v(\varnothing) = 0v({1})−v(∅)=0
2,1,3 v({1,2})−v({1})=0v(\{1,2\})-v(\{1\}) = 0v({1,2})−v({1})=0
2,3,1 v({1,2,3})−v({2,3})=1−1=0v(\{1,2,3\})-v(\{2,3\}) = 1-1=0v({1,2,3})−v({2,3})=1−1=0
3,1,2 v({1,3})−v({3})=1−0=0v(\{1,3\})-v(\{3\}) = 1-0=0v({1,3})−v({3})=1−0=0
3,2,1 v({1,2,3})−v({2,3})=1−1=0v(\{1,2,3\})-v(\{2,3\}) = 1-1=0v({1,2,3})−v({2,3})=1−1=0

φ1(v)=16×1=16\varphi_1(v) = \frac{1}{6}\times 1 = \frac{1}{6}φ1​(v)=61​×1=61​
根据对称性,φ1(v)=φ2(v)=16\varphi_1(v) = \varphi_2(v) = \frac{1}{6}φ1​(v)=φ2​(v)=61​
根据有效性,φ3(v)=23\varphi_3(v) = \frac{2}{3}φ3​(v)=32​

举例2

共有三家公司,公司1,2,3单独投资可盈利v1=100,v2==200,v3=300v_1=100,v_2==200,v_3=300v1​=100,v2​==200,v3​=300,如果公司1和公司2联合,可获利v12=500v_{12}=500v12​=500;公司2和公司3联合,可获利v23=600v_{23}=600v23​=600;公司1和公司3联合,可获利v13=700v_{13}=700v13​=700;公司1、公司2和公司3联合,可获利v123=1000v_{123}=1000v123​=1000;那么三个公司一起合作,每个公司应各获利多少?

找出所有排列3!,公司1的边际贡献率如下表

Order R MC1
1,2,3 v({1})−v(∅)=100v(\{1\})-v(\varnothing) = 100v({1})−v(∅)=100
1,3,2 v({1})−v(∅)=100v(\{1\})-v(\varnothing) = 100v({1})−v(∅)=100
2,1,3 v({1,2})−v({1})=500−200=300v(\{1,2\})-v(\{1\}) = 500-200=300v({1,2})−v({1})=500−200=300
2,3,1 v({1,2,3})−v({2,3})=1000−600=400v(\{1,2,3\})-v(\{2,3\}) = 1000-600=400v({1,2,3})−v({2,3})=1000−600=400
3,1,2 v({1,3})−v({3})=700−300=400v(\{1,3\})-v(\{3\}) = 700-300=400v({1,3})−v({3})=700−300=400
3,2,1 v({1,2,3})−v({2,3})=1000−600=400v(\{1,2,3\})-v(\{2,3\}) = 1000-600=400v({1,2,3})−v({2,3})=1000−600=400

φ1(v)=16×1700=1700/6\varphi_1(v) = \frac{1}{6}\times 1700 = 1700/6φ1​(v)=61​×1700=1700/6

找出所有排列3!,公司2的边际贡献率如下表

Order R MC2
1,2,3 v({1,2})−v({1})=500−100=400v(\{1,2\})-v(\{1\}) = 500-100=400v({1,2})−v({1})=500−100=400
1,3,2 v({1,2,3})−v({1,3})=1000−700=300v(\{1,2,3\})-v(\{1,3\}) = 1000-700=300v({1,2,3})−v({1,3})=1000−700=300
2,1,3 v({2})−v(∅)=200v(\{2\})-v(\varnothing) =200v({2})−v(∅)=200
2,3,1 v({2})−v(∅)=200v(\{2\})-v(\varnothing) =200v({2})−v(∅)=200
3,1,2 v({1,2,3})−v({1,3})=1000−700=300v(\{1,2,3\})-v(\{1,3\}) = 1000-700=300v({1,2,3})−v({1,3})=1000−700=300
3,2,1 v({2,3})−v({3})=600−300=300v(\{2,3\})-v(\{3\}) = 600-300=300v({2,3})−v({3})=600−300=300

φ2(v)=16×1700=1700/6\varphi_2(v) = \frac{1}{6}\times 1700 = 1700/6φ2​(v)=61​×1700=1700/6

找出所有排列3!,公司3的边际贡献率如下表

Order R MC3
1,2,3 v({1,2,3})−v({1,2})=1000=500=500v(\{1,2,3\})-v(\{1,2\}) = 1000=500=500v({1,2,3})−v({1,2})=1000=500=500
1,3,2 v({1,3})−v({1})=700−100=600v(\{1,3\})-v(\{1\}) = 700-100=600v({1,3})−v({1})=700−100=600
2,1,3 v({1,2,3})−v({1,2})=1000−500=500v(\{1,2,3\})-v(\{1,2\}) = 1000-500=500v({1,2,3})−v({1,2})=1000−500=500
2,3,1 v({2,3})−v({2})=600−200=400v(\{2,3\})-v(\{2\}) = 600-200=400v({2,3})−v({2})=600−200=400
3,1,2 v({3})−v(∅)=300v(\{3\})-v(\varnothing) = 300v({3})−v(∅)=300
3,2,1 v({3})−v(∅)=300v(\{3\})-v(\varnothing) = 300v({3})−v(∅)=300

φ3(v)=16×2600=2600/6\varphi_3(v) = \frac{1}{6}\times 2600 = 2600/6φ3​(v)=61​×2600=2600/6

合作博弈:夏普利值(shapley value)性质与算法相关推荐

  1. Shapley Value(****夏普利值,沙普利值****)

    Shapley Value(夏普利值,沙普利值) 夏普利值是一种衡量合作博弈中各个参与者对于整体胜利的贡献的方法.在合作博弈中,多个参与者共同合作,以实现共同的目标或获得共同的奖励.夏普利值的核心思想 ...

  2. 博弈论夏普利值!提高机器学习可解释性的新方法!

    全文共7141字,预计学习时长21分钟 图源:Unsplash 从"约翰•纳什"到"板球世界杯" 还记得<美丽心灵>的男主(也是现实生活中传奇的一代 ...

  3. 先定产权还是先定价格,数据交易场景下的市场设计问题,合作博弈中“沙普利值”

    目录 先定产权还是先定价格 数据交易场景下的市场设计问题 价格是什么呢?

  4. 【文献研究】车辆路径问题静态合作博弈的数学模型及算法实现

    前言:以2015年发表在期刊<MATHEMATICAL GAME THEORY AND APPLICATIONS>上的文章<Strong Coalitional Equilibriu ...

  5. 博弈论——合作博弈的Shapley值如何求解?

    博弈论--合作博弈的Shapley值如何求解? 计算合作博弈贡献从而更公平分配利益权重的算法--Shapley值方法 [问题1] 甲.乙.丙三人合作经商.倘若甲.乙合作可获利70万元, 甲.丙合作可获 ...

  6. 【文献研究】班轮联盟下合作博弈的概念

    前言:以下是本人做学术研究时搜集整理的资料,供有相同研究需求的人员参考. 1. 合作博弈的一些概念 合作博弃中比较重要的问题是共赢状态下的利润分配问题,这关系到联盟的合作机制能否长期有效.这里首先介绍 ...

  7. 博弈论——非合作博弈 什么是纳什均衡

    博弈论--非合作博弈 纳什均衡用一句话来概括就是--博弈的所有参与人都为了满足自己 的个人利益而选择牺牲集体利益而导致的全体参与人都吃亏的均衡状态. 也可以粗略的理解为:要死大家一起死. 纳什均衡的本 ...

  8. MATLAB代码:基于非合作博弈的多微网P2P交易策略研究

    MATLAB代码:基于非合作博弈的多微网P2P交易策略研究 关键词:微网 P2P交易 非合作博弈 交易电价 参考文档:<基于博弈论的多微电网系统交易模式研究>完全复现 仿真平台:MATLA ...

  9. 考虑条件风险价值的多微网主从-合作博弈动态定价与优化调度模型

    考虑条件风险价值的多微网主从-合作博弈动态定价与优化调度模型 摘要:代码主要做的是多微网的能量交互与动态定价问题. 代码整体采用主从博弈框架,上层是零售商的动态定价模型,同时考虑了条件风险价值,对不确 ...

  10. C#,K-均值(K-Means)聚类算法的核心源代码

    一.詹姆斯·麦昆(James MacQueen) IMS研究员詹姆斯·B·麦昆于2014年7月15日病逝,享年85岁.他的妻子安和他们的三个孩子唐纳德.凯特和玛丽以及五个孙子孙女幸存下来. 从1962 ...

最新文章

  1. CVPR 2020丨UDVD:用于可变退化的统一动态卷积超分辨率网络
  2. 一些知识点的初步理解_6(核函数,ing...)
  3. JS获取用户控件中的子控件Id
  4. 对YUV4:2:0认识理解
  5. win10下openpose1.5安装
  6. python 把中文句子分割成一个一个的字(英文适用)
  7. P1070 道路游戏
  8. IP地址详解、无分类编址和路由寻址(计算机网络二)
  9. kali安装邮件客户端
  10. 【爬坑记录】记录搭建fabric 遇到的问题-network e2ecli_default not found
  11. 最新的计算机知识点总结,2017计算机一级基础知识点总结
  12. DevOps之自动化测试
  13. 3个自由度搬运机械手设计【CAD图纸+毕业论文+电路图+梯形图+接线图】
  14. MATLAB AppDesigner 中TextArea保留原有信息并换行显示提示信息
  15. FineBI学习笔记
  16. 3G上网卡在Liunx系统上实现上网的过程
  17. 学生信息管理系统测试总报告
  18. 3D Tiles Next CesiumJS 路线图
  19. 岩棉夹芯板英标BS476-20BS476-22耐火测试
  20. 上传文件过大时,报The field file exceeds its maximum permitted size of 1048576 bytes问题

热门文章

  1. JXLS (excel报表生成/导出工具)的配置与使用
  2. 阳光动力2号太阳能飞机的基本工作原理
  3. okcc呼叫中心外呼系统小白的使用教程
  4. 【Godot】对 Godot 节点设计的思考
  5. [经验分享] 收费版文字转语音,免费使用
  6. 用两个队列实现栈---用两个队列实现栈
  7. IDEA中Terminal窗口中无法使用maven命令
  8. 漫画 | 为什么美国人发明了互联网?
  9. 文件被占用?系统自带的“资源监视器(resmon)”也能帮你找到占用它的真凶
  10. 设计模式之中介者模式