All-Pay Contests(博弈论+机制设计) 论文阅读笔记
All-Pay Contests 论文阅读笔记
- 一、基本信息
- 二、文章摘要
- 三、核心模型
- 四、分析过程
- 五、本文总结
一、基本信息
- 题目:全支付竞赛
- 作者:RON SIEGEL
二、文章摘要
- 以下内容取自原文摘要部分:
- 本文研究了一类博弈,即 “全支付竞赛”,它反映了游说、市场权力竞争、劳动力市场竞赛和研发竞赛等情景中固有的一般不对称性和沉没投资。参赛者通过选择一个分数来争夺几个同质奖项中的一个。考虑到输或者赢,以一个更低的分数来参与博弈略微更好一点。这种构想允许不同的生产技术、资本成本、早期投资、风险态度以及有条件和无条件的投资等等。我为参赛者的均衡收益提供了形式完备的公式并且分析了参赛者的参与情况。竞赛的一种特殊形式是多奖励的、完全信息的全支付拍卖。
- 我的总结:本文聚焦全支付竞赛(拍卖),提出了可分离竞赛、一般化竞赛两大概念。着重研究一般化竞赛的性质,定理1有关一般化竞赛的收益性质,定理2有关一般化竞赛的参与性质。这些性质未来可作为竞赛设计的理论指导。
三、核心模型
- 在一场竞赛中,nnn位参赛者竞争mmm个同质奖品,0<m<n0<m<n0<m<n。参赛者{1,...,n}\{1,...,n\}{1,...,n}的集合表示为NNN。参赛者通过同步且独立地选择一个分数的方式来参与竞赛,参赛者iii选择分数si∈Si=[ai,∞)s_i\in S_i=[a_i,\infty)si∈Si=[ai,∞),其中aia_iai代表该参赛者的起始分数,或者说是起始优势,决定了他选择分数的下限,下限越高表明他选择高分数的代价更小。mmm个参赛者中拥有最高分数的参赛者每人获得一个奖品。
- 参赛者iii的效用函数表示如下。其中Pi(s)P_i(s)Pi(s)表示参赛者iii获奖的概率(输入为分数组合);vi(si)v_i(s_i)vi(si)表示参赛者iii获奖后的估值(输入为参赛者iii的分数);ci(si)c_i(s_i)ci(si)表示参赛者iii失败的代价(输入为参赛者iii的分数)。参赛者获胜的概率取决于所有人的分数;但是胜负的效用估值却只与自己选择的分数有关。
ui(s)=Pi(s)vi(si)−(1−Pi(s))ci(si)u_i(s)=P_i(s)v_i(s_i)-(1-P_i(s))c_i(s_i) ui(s)=Pi(s)vi(si)−(1−Pi(s))ci(si)
参赛者的获胜概率表示如下。其中mmm是上文提到的奖品个数。当有mmm个或者更多的人比你分数更高时,你肯定无法获奖;当有N−mN-mN−m个或者更多的人比你分数更低时,你肯定可以获奖;其他情况下,获奖概率在0,10,10,1之间。并且满足∑j=1nPj(s)=m\sum_{j=1}^nP_j(s)=m∑j=1nPj(s)=m,即所有人获奖概率的总和等于奖品个数。
Pi(s)={0有m或更多其他参赛者满足sj>si1有N−m或更多其他参赛者满足sj<sianyvaluein[0,1]其他情况P_i(s)= \begin{cases} 0& \text{有$m$或更多其他参赛者满足$s_j>s_i$}\\ 1& \text{有$N-m$或更多其他参赛者满足$s_j<s_i$}\\ any \space value \space in \space [0,1] & \text{其他情况} \end{cases} Pi(s)=⎩⎪⎨⎪⎧01any value in [0,1]有m或更多其他参赛者满足sj>si有N−m或更多其他参赛者满足sj<si其他情况 - 满足下列三条假设。A1表明分数越高,获胜效用不会增加并且失败代价会增加,也就是说无论输赢,选择较小的分数都是略好的;A2表明初始分数aia_iai的获胜估值为正、失败代价为0,并且以无穷大的分数获胜的效用是小于0的;A3表明当获胜效用为0时,失败代价一定大于0。这些性质都是全支付竞赛所独有的,完全信息一价拍卖就无法实现。
A1:vi,−civ_i,-c_ivi,−ci都是连续且非减的。
A2:vi(ai)>0v_i(a_i)>0vi(ai)>0,limsi→∞vi(si)<ci(ai)=0lim_{s_i\rightarrow \infty}v_i(s_i)<c_i(a_i)=0limsi→∞vi(si)<ci(ai)=0。
A3:当vi(si)=0v_i(s_i)=0vi(si)=0时,ci(si)>0c_i(s_i)>0ci(si)>0。 - 接下来将效用函数中胜利效用与失败效用细致化定义。胜利效用可分为两部分,固定的奖品效用减去胜利代价即vi(si)=Vi−ciw(si)v_i(s_i)=V_i-c_i^w(s_i)vi(si)=Vi−ciw(si)。失败效用只有失败代价一部分组成即ci=ciLc_i=c_i^Lci=ciL。更新后的参赛者效用函数如下。再进一步,效用函数公式还可以体现参赛者的风险偏好,根据自己的偏好将实际效用映射为其他值,带有风险偏好的效用函数如下。
ui(s)=Pi(s)(Vi−ciW(si))−(1−Pi(s))ciL(si)ui(s)=Pi(s)f(Vi−ciW(si))−(1−Pi(s))f(ciL(si))(带风险偏好)u_i(s)=P_i(s)(V_i-c_i^W(s_i))-(1-P_i(s))c_i^L(s_i)\\ u_i(s)=P_i(s)f(V_i-c_i^W(s_i))-(1-P_i(s))f(c_i^L(s_i))(带风险偏好)\\ ui(s)=Pi(s)(Vi−ciW(si))−(1−Pi(s))ciL(si)ui(s)=Pi(s)f(Vi−ciW(si))−(1−Pi(s))f(ciL(si))(带风险偏好) - 以下几条定义在后续的均衡分析中至关重要。
1.参赛者iii的reachreachreach是指获胜估值等于0对应的最高分数,即ri=max{si∈Si∣vi(si)=0}r_i=max\{s_i\in S_i|v_i(s_i)=0\}ri=max{si∈Si∣vi(si)=0}。将参赛者按照reachreachreach从大到小的顺序排序,即r1>=r2>=...>=rnr_1>=r_2>=...>=r_nr1>=r2>=...>=rn。
2.参赛者m+1m+1m+1为marginalplayermarginal \space playermarginal player。
3.竞赛的thresholdTthreshold \space Tthreshold T定义为marginalplayermarginal \space playermarginal player的reachreachreach,即T=rm+1T=r_{m+1}T=rm+1。
4.参赛者iii的powerpowerpower定义为以TTT获胜时的估值,即wi=vi(max{ai,T})w_i=v_i(max\{a_i,T\})wi=vi(max{ai,T})。特别的是,marginalplayermarginal \space playermarginal player的powerpowerpower为0。 - Generic Conditions
一般化条件有如下两条,将满足一般化条件的竞赛称之为一般化竞赛(generic contest)。在一般化竞赛中,前mmm个参赛者的力量为正;后续参赛者的力量非正。
(1)Power Condition:只有边际参赛者的力量为0。
(2)Cost Condition:边际参赛者对胜利的估值函数在门限值范围内是严格递减的。(由于vi(si)=Vi−ci(si)v_i(s_i)=V_i-c_i(s_i)vi(si)=Vi−ci(si),该条件也可以表述为边际参赛者的代价函数严格递增)
四、分析过程
- 定理1有关均衡收益情况,定理2有关均衡参与情况。
- 大体分析流程如下:通过证明、应用定理1,得到一般化竞赛(Generic Contest)的收益结果(Payoff Result),该收益结果是在最严格条件下得到的肯定是最强力的结果。继续放松条件分析,当不满足一般化条件但满足同质化条件,当既不满足一般化条件也不满足同质化条件时各有什么样的性质。
- 定理1的定义、应用、证明
定理1的定义
在一般化竞赛的任意均衡中,每位参赛者的期望收益等于其力量与0之间的较大值。
定理1表明:在一般化竞赛中前mmm个参赛者的期望效用为正,后续参赛者的期望效用为0,换句话说一个参赛者只有其分数上限(reach)高于门限值(T)时期望收益才为正。期望收益是将混合策略考虑进来,混合策略是指每位参赛者为自己所选择的分数设定一个分布,期望收益就是针对该分布下的收益求期望。
定理1的证明过程:
LEAST LEMMA:均衡GGG中的参赛者期望收益至少是他的力量与0之间的较大值。(证明请见原文)
TIE LEMMA:假设在均衡GGG中有两个及以上的以严格正概率选择了分数xxx,那么这些参赛者要么同时获胜要么同时失败。(证明请见原文)
ZERO LEMMA:在均衡GGG中,至少有n-m个玩家针对他们获胜的概率为0或任意地接近0的情况做出最优响应,这些玩家的期望收益最多为0。(证明请见原文)
THRESHOLD LEMMA:前mmm个参赛者做出的最优响应接近或者超过了门限值,因此期望收益至多等于他们的力量值。(证明请见原文)
结合LEAST LEMMA与THRESHOLD LEMMA,我们可以得到前mmm个参赛者期望效用至多、至少为他的力量也就是等于他的力量。后续参赛者期望效应为0,因此定理1得证。
- Generic Contest中的收益分析结果
1.一般化竞赛中,均衡收益仅取决于参赛者对于以门限值获胜时的效用估值。从应用角度,只有每位参赛者的reach、以及门限值处的胜利估值(power)需要计算。参赛者的失败代价并不会影响收益。
2.一般化竞赛中,拥有正收益的参赛者数量等于奖品数量。
3.一般化竞赛中,一定会存在纳什均衡。 - 对于非Generic竞赛来说
引理2:
每一个竞赛(一般化或非一般化)满足条件每位参赛者的收益都等于其力量与0之间的较大值,这样的竞赛都至少有一个均衡。
引理3:
在所有参赛者同质的竞赛(一般化或非一般化)的任意一个均衡中,所有参赛者都有收益为0。
对于既不一般化也不满足同质条件的竞赛来说,在部分均衡中的某个参赛者的收益可能接近于其初始分数下的胜利估值(初始状态下代价为0,即胜利估值viv_ivi等于奖品本来价值ViV_iVi),即使他的力量非常小。
接下来我们看一个具体例子,有关非Generic Contests:
该例子Cost Condition不成立(即代价函数在门限值范围内非严格递增),因此不是一个Generic Contest,也就不成立定理1得到的Payoff Result。设想一个拥有两个参赛者、一个奖品的分离竞赛,并且两个参赛者对于奖品的估值固定都为111。代价函数如下,其中b<1,0<d<1b<1,0<d<1b<1,0<d<1。
c1(x)=bxc2(x)={x/dif 0<=x<d,1if d<=x<=1,2x−1if x>1,c_1(x)=bx\\ c_2(x)= \begin{cases} x/d& \text{if \space 0<=x<d,}\\ 1& \text{if \space d<=x<=1,}\\ 2x-1 & \text{if \space x>1,} \end{cases} c1(x)=bxc2(x)=⎩⎪⎨⎪⎧x/d12x−1if 0<=x<d,if d<=x<=1,if x>1,
回顾之前有关reach、marginal player、power、threshold定义,我们可以得到:r1=1/b>1,r2=1r_1=1/b>1,r_2=1r1=1/b>1,r2=1,因此按照reach排序顺序不动,m=1m=1m=1,m+1m+1m+1位参赛者也就是2号是marginal player,threshold为T=r2=1T=r_2=1T=r2=1,两位参赛者的power w1=1−b>0,w2=0w_1=1-b>0,w_2=0w1=1−b>0,w2=0。下面展示的(G1,G2)(G_1,G_2)(G1,G2)是其中一个均衡。其中参赛者111的均衡收益为1−bd>w11-bd>w_11−bd>w1,当d→0d\rightarrow 0d→0时,收益接近于111,也就是商品本来的价值。(从而应证上面结论)
均衡是如何求出来的?怎么证明是均衡?
G1(x)={0if x<0,x/dif 0<=x<=d,1if x>d,G2(x)={0if x<0,1−bd+bxif 0<=x<=d,1if x>d,G_1(x)= \begin{cases} 0& \text{if \space x<0,}\\ x/d& \text{if \space 0<=x<=d,}\\ 1 & \text{if \space x>d,} \end{cases}\\ G_2(x)= \begin{cases} 0& \text{if \space x<0,}\\ 1-bd+bx& \text{if \space 0<=x<=d,}\\ 1 & \text{if \space x>d,} \end{cases} G1(x)=⎩⎪⎨⎪⎧0x/d1if x<0,if 0<=x<=d,if x>d,G2(x)=⎩⎪⎨⎪⎧01−bd+bx1if x<0,if 0<=x<=d,if x>d,
- 定理2的定义与应用
定理2的定义
在一般化竞赛中,如果边际参赛者正则化后的失败代价严格低于其后续某个参赛者iii,并且边际参赛者正则化后的胜利估值大于等于该参与者iii,则该参赛者iii不会参与到任何均衡中。特别的是,如果这个条件对于NL除去{m+1}N_L除去\{m+1\}NL除去{m+1}都成立的话,那么任何均衡中只有NW∪{m+1}N_W\cup \{m+1\}NW∪{m+1}可能参与。形式化表示如下:
cm+1(max{am+1,x})vm+1(am+1)<ci(x)vi(ai),对于所有x∈Si,ci(x)>0vm+1(max{am+1,x})vm+1(am+1)>=vi(x)vi(ai),对于所有x∈Si\frac{c_{m+1}(max\{a_{m+1},x\})}{v_{m+1}(a_{m+1})}<\frac{c_i(x)}{v_i(a_i)},对于所有x\in S_i,c_i(x)>0\\ \frac{v_{m+1}(max\{a_{m+1},x\})}{v_{m+1}(a_{m+1})}>=\frac{v_i(x)}{v_i(a_i)},对于所有x\in S_i vm+1(am+1)cm+1(max{am+1,x})<vi(ai)ci(x),对于所有x∈Si,ci(x)>0vm+1(am+1)vm+1(max{am+1,x})>=vi(ai)vi(x),对于所有x∈Si
定理2表明在一般化全支付拍卖中,只有前m+1m+1m+1个参赛者可能会参与。后续参赛者相较于边际参赛者,代价更大收益却更小,没有竞争优势因此可能选择不参加。只有当后续参赛者相较于边际参赛者有一定局部优势,才有可能选择参与竞赛。
五、本文总结
- 全支付竞赛在竞赛者之间捕捉一般化的非对称性信息,并且既允许下沉投资也允许条件投资。这篇文章提供了一个在一般化竞赛中针对参赛者期望收益形式完备的表达,并且分析了参赛者的参与情况。本文主要观点是reach、powerreach、powerreach、power两个变量对于分析竞赛时至关重要。
- 另外,这个观点投入使用后好像复杂问题变得简单。比如说,考虑租值消散问题,该问题是租值搜寻领域的核心问题。在一个拥有mmm个价值为VVV的可分离竞赛中,总均衡支出是mVmVmV,比参赛者收益要少。当获胜参赛者的powerpowerpower接近于0,该情况发生在当他们在门限值处的代价接近于VVV,此时租值消散是完全的。当获胜参与者的powerpowerpower接近于VVV,该情况发生在他们在门限值处的代价接近于000,此时没有租值是被消散的。
- 竞赛中加入参赛者的行为永远不会降低门限值,甚至还可能使得现有参赛者的情况更加糟糕。如果新参赛者的reachreachreach低于现有门限值,现有参赛者的收益不会改变并且新参赛者的收益为000。奖品的加入会使得第m+2m+2m+2个参赛者成为边际参赛者,这降低了门限值并且使得现有参与者情况更好。与之相反,使得奖品更加有价值会使得现有参赛者情况更糟糕,因为它抬高了门限值。该问题的未来研究聚焦于本文研究成果如何影响竞赛设计。
All-Pay Contests(博弈论+机制设计) 论文阅读笔记相关推荐
- Wisdom of the Crowd Voting:Truthful Aggregation of Voter Information and Preference(博弈论+机制设计) 论文阅读笔记
Wisdom of the Crowd Voting:Truthful Aggregation of Voter Information and Preferences 论文阅读笔记 一.基本信息 二 ...
- Peer pressure in extortion game can resolve social dilemma(博弈论+机制设计) 论文阅读笔记
Peer pressure in extortion game can resolve social dilemma 论文阅读笔记 一.基本信息 二.文章摘要 三.核心模型 四.分析过程 五.论文总结 ...
- Designing an optimal contest(博弈论+机制设计) 论文阅读笔记
Designing an optimal contest 论文阅读笔记 一.基本信息 二.文章摘要 三.背景介绍 四.核心模型 五.核心结论 六.总结展望 一.基本信息 题目:设计一个最优竞赛 作者: ...
- keras cnn注意力机制_2019 SSA-CNN(自注意力机制)目标检测算法论文阅读笔记
背景 <SSA-CNN Semantic Self-Attention CNN for Pedestrian Detection>是2019 的工作,其作者来自于南洋理工.这篇文章主要是做 ...
- DCP(Deep Closest Point)论文阅读笔记以及详析
DCP论文阅读笔记 前言 本文中图片仓库位于github,所以如果阅读的时候发现图片加载困难.建议挂个梯子. 作者博客:https://codefmeister.github.io/ 转载前请联系作者 ...
- 论文阅读笔记:《一种改进的图卷积网络半监督节点分类》
论文阅读笔记:<一种改进的图卷积网络半监督节点分类> 文章目录 论文阅读笔记:<一种改进的图卷积网络半监督节点分类> 摘要: 引言 非欧几里得数据 1 深度池化对偶图神经网络 ...
- The Chubby lock service for loosely-coupled distributed systems 论文阅读笔记
The Chubby lock service for loosely-coupled distributed systems 论文阅读笔记 特点:高可靠.高可用.粗粒度锁服务.小文件存储 主要用于高 ...
- 论文阅读笔记 - Chubby: The Chubby lock service for loosely-coupled distributed systems
作者:刘旭晖 Raymond 转载请注明出处 Email:colorant at 163.com BLOG:http://blog.csdn.net/colorant/ 更多论文阅读笔记 http:/ ...
- 论文阅读笔记 | 目标检测算法——FSAF算法
如有错误,恳请指出 文章目录 1. Introduction 2. FSAF Module 2.1 Network Architecture 2.2 Ground-truth and Loss 2.2 ...
- 【SOD论文阅读笔记】Visual Saliency Transformer
[SOD论文阅读笔记]Visual Saliency Transformer 一.摘要 Motivation: Method: Experimental results 二.Introduction ...
最新文章
- 2021年大数据Flink(九):Flink原理初探
- 昨晚,我们的消费者居然停止消费kafka集群数据了
- SAP MM 采购报表中Delivery Date的显示
- CA ARCserve Backup系列(3)—安装代理(Linux篇)
- img文件解包工具_使用tar归档命令,就不怕文件多!
- Linux运维:如何根据端口号查看哪个应用占用?
- Tensorflow代码转pytorch代码 函数的转换
- jsp和mysql答辩_如何应对JSP连接MySQL数据库问题_网站数据库怎么连接到网页答辩问题...
- 如何巧妙的使用pandas结合xlsxwriter实现对表格的读写以及插入图片操作
- Centos 5.6 安装subversion总结
- php定义枚举,PHP枚举
- 中文版putty后门事件分析
- 曲奇云盘资源搜索引擎_曲奇云盘下载-曲奇云盘官网版v3.2.4-sosyes
- mysql间隙锁_解决MySQL可重复读——详解间隙锁
- IC卡管理系统(Java基础)
- python实现超级玛丽小游戏(动图演示+源码分享)
- 剑指offer之斐波那契数列求解
- 【转】O'Reilly Java系列书籍建议阅读顺序(转自蔡学庸)
- C++:函数指针调用方法
- int int int * int**的区别、联系和用途