合作博弈(coalitional game)——核仁(Nucleolus)初解
来源
Coalitional Game Theory for Communication Networks
前置知识
由于详细解释需要一些博弈论的知识,如TU、core等,所以这里只作初解,大致解释下什么叫做Nucleolus方法。
这里我们讨论的是TU canonical games,不理解也没关系,当成最普通的博弈情景就行了。
理解
Nucleolus,本质就是最小化合作博弈中联盟(coalition)的最大不满意程度的一种分配方法。本质是min-max。
概念
- 合作博弈:字面上理解。
- 联盟 coalition:一次博弈中组队的几个人,构成一个coalition,常用SSS表示。
- 归因 imputation:对博弈中所有人的一种分配方式,常用xxx表示,是一个vector,其中xjx_jxj代表对第j个人分配的数值。
- 联盟值:评价联盟SSS的价值(worth),也有时候被称为特征函数,常用v(S)v(S)v(S)表示。在本文讨论的情况下v是一个实数值。
- 超出 excess(翻译的可能不准):一个联盟对某一个分配的不满意程度。e(x,S)=v(S)−∑j∈Sxje(x,S)=v(S)-\sum_{j \in S} x_je(x,S)=v(S)−∑j∈Sxj,即联盟S的价值与联盟中所有人分配的值的差值。可以看出,excess越小,不满意程度越低;若一次博弈中所有S的excess都是0或负值,则这样的x是存在于core中的。(最后一句话可以不用理解)
- O(x)O(x)O(x):一次博弈中所有excess所构成的vector,以非增的顺序排列。
- ≺lex\prec_{lex}≺lex 顺序小于 lexographically less:定义的一种符号。若y≺lexzy\prec_{lex} zy≺lexz,其中yz都是k维向量,则存在l∈{1,...,k}l \in \{1,...,k\}l∈{1,...,k},使得y1=z1,...yl−1=zl−1,yl<zly_1=z_1,...y_{l-1}=z_{l-1},y_l<z_ly1=z1,...yl−1=zl−1,yl<zl成立。
核仁是什么
一个公式解决:
O(x)≺lexO(δ)O(x)\prec_{lex}O(\delta)O(x)≺lexO(δ)
其中x就是Nucleolus了,δ\deltaδ是其余任意的imputation。满足这个式子,说明x能使最大的excess最小化,即让最不满意的S不要太过不满意……
举个例子
一个男人有三个老婆,然后他死了。遗产要分给这三个人。1号老婆说要分100元,2号老婆说要分200元,3号老婆说要分300元。如果遗产大于600当然好说,但如果小于600,该怎么分配呢?
我们用Nucleolus来解答这个问题。
记遗产为α\alphaα,3个人有7种可能存在的联盟,我们假设每一个联盟的v(S)就是总遗产数减去S之外其他人需要的遗产数,即:v(S)=max(0,α−∑i∈N\Sci)v(S)=max(0,\alpha -\sum_{i \in N\backslash S}c_i)v(S)=max(0,α−i∈N\S∑ci)
其中N是全体人员的集合,cic_ici是第i个人声称要求的遗产数目。
我们不妨假定α=100\alpha=100α=100,计算这7种联盟下对不同分配方式x的excess,从而得到O(x)O(x)O(x)。
- 第一种分配方式x1x_1x1,1号给20元,2号给30元,3号给50元。
我们记联盟为{1},{2},{3},{1,2},{2,3},{1,3},{1,2,3}。则:O(x1)=[−20,−30,−50,−50,−70,−80,−100]TO(x_1)=[-20,-30,-50,-50,-70,-80,-100]^TO(x1)=[−20,−30,−50,−50,−70,−80,−100]T
每一项就是对每一个v(S)减去实际分配给S的钱,不懂的可以去看看上面的定义。最后结果按照非增方式排序。
- 第二种分配方式x2x_2x2,1号给1003\frac{100}33100元,2号给1003\frac{100}33100元,3号给1003\frac{100}33100元。
同样可以得到:
O(x2)=[−1003,−1003,−1003,−2003,−2003,−2003,−100]TO(x_2)=[-\frac{100}3,-\frac{100}3,-\frac{100}3,-\frac{200}3,-\frac{200}3,-\frac{200}3,-100]^TO(x2)=[−3100,−3100,−3100,−3200,−3200,−3200,−100]T
可以看到,O(x2)≺lexO(x1)O(x_2)\prec_{lex}O(x_1)O(x2)≺lexO(x1),至少说明x2x_2x2的分配方式更优。实际上,平均分配是α=100\alpha=100α=100情况下的最优分配方式,这里就不做证明了。
这里可能存在一个疑惑的点:为什么v(S)是这么定义的?关于这点我也没想清楚,如果有谁知道的话麻烦在评论区谈谈。
总结
博弈论真烦。
合作博弈(coalitional game)——核仁(Nucleolus)初解相关推荐
- 【文献研究】车辆路径问题静态合作博弈的数学模型及算法实现
前言:以2015年发表在期刊<MATHEMATICAL GAME THEORY AND APPLICATIONS>上的文章<Strong Coalitional Equilibriu ...
- 博弈论——非合作博弈 什么是纳什均衡
博弈论--非合作博弈 纳什均衡用一句话来概括就是--博弈的所有参与人都为了满足自己 的个人利益而选择牺牲集体利益而导致的全体参与人都吃亏的均衡状态. 也可以粗略的理解为:要死大家一起死. 纳什均衡的本 ...
- 博弈论——合作博弈的Shapley值如何求解?
博弈论--合作博弈的Shapley值如何求解? 计算合作博弈贡献从而更公平分配利益权重的算法--Shapley值方法 [问题1] 甲.乙.丙三人合作经商.倘若甲.乙合作可获利70万元, 甲.丙合作可获 ...
- 【文献研究】班轮联盟下合作博弈的概念
前言:以下是本人做学术研究时搜集整理的资料,供有相同研究需求的人员参考. 1. 合作博弈的一些概念 合作博弃中比较重要的问题是共赢状态下的利润分配问题,这关系到联盟的合作机制能否长期有效.这里首先介绍 ...
- MATLAB代码:基于非合作博弈的多微网P2P交易策略研究
MATLAB代码:基于非合作博弈的多微网P2P交易策略研究 关键词:微网 P2P交易 非合作博弈 交易电价 参考文档:<基于博弈论的多微电网系统交易模式研究>完全复现 仿真平台:MATLA ...
- 考虑条件风险价值的多微网主从-合作博弈动态定价与优化调度模型
考虑条件风险价值的多微网主从-合作博弈动态定价与优化调度模型 摘要:代码主要做的是多微网的能量交互与动态定价问题. 代码整体采用主从博弈框架,上层是零售商的动态定价模型,同时考虑了条件风险价值,对不确 ...
- 先定产权还是先定价格,数据交易场景下的市场设计问题,合作博弈中“沙普利值”
目录 先定产权还是先定价格 数据交易场景下的市场设计问题 价格是什么呢?
- 基于非合作博弈的风-光-氢微电网容量优化配置(Matlab代码实现)
- Matlab/Cplex代码:基于合作型Stackelberg博弈的考虑差别定价和风险管理的微网运行策略
Matlab/Cplex代码:基于合作型Stackelberg博弈的考虑差别定价和风险管理的微网运行策略 参考International Journal of Electrical Power and ...
- 博弈的意思_“博弈”是什么意思,用在什么地方?
展开全部 "博弈"的意思是62616964757a686964616fe78988e69d8331333366303732:下棋. "博弈"可以用在特指对选择的 ...
最新文章
- AI人才抢夺“生猛”: 应届博士年薪涨到80万元
- 服务器如何安装虚拟声卡,虚拟声卡驱动安装步骤_虚拟声卡驱动有什么使用要求...
- leetcode 136. Single Number
- Unity AOP 处理异常的方法
- 数据库-优化-groupby的优化
- 优化技巧与理论(part1)
- WireShark抓包,may be caused by ip checksum offload的解决办法
- 一定质量的封闭气体被压缩后_单螺杆压缩机
- 【Hbase】HBase 更改表名
- 剑指offer之删除链表中重复的结点
- 新手建网站笔记(四)--快捷键
- Rust : CTP 中异步处理
- SpringBoot整合Shiro框架
- 《机器学习实战》--资料下载和运行环境
- 用户自治的数字身份在我国的标准
- 论文记载:FRAP:Learning Phase Competition for Traffic Signal Control
- HtmlHelper用法大全(下)
- mysql设置字符集gb2312_mysq查询语句包含中文以及中文乱码,字符集 GBK、GB2312、UTF8的区别...
- 计算机视觉可解释性——卷积神经网络中间层的可视化
- 微信视频号视频免费下载最新的4种办法
热门文章
- Android fragment原因,Android总结之Fragment
- 希尔密码(加密、解密、破解)
- SDIO接口简单描述
- python计算机视觉pdf百度云下载_Python计算机视觉编程(pdf+epub+mobi+txt+azw3)
- 相信美好就能遇见美好—西安独行三日短途穷游 攻略
- 粒子群算法求解二元函数极值-附带800字程序说明
- html分辨手机电脑,html自动识别手机或者pc端
- gan怎么输入一维数据_GAN网络,利用gan网络完成对一维数据点的生成
- php 网络爬虫开源,phpspider php爬虫框架
- C语言的文件读取------C语言