近期几篇有关All-Pay论文总结（博弈论+机制设计）

近期几篇有关All-Pay论文总结

1.Nash Convergence of Mean-Based Learning Algorithms in First Price Auctions
2.Designing an optimal contest
3.Optimal rewards in contests
4.Asymmetric All-Pay Auctions with Incomplete Information:The Two-Player Case
5.Asymmetric All-Pay Auctions with Two Types
6.All-pay auctions—an experimental study
7.后续

1.Nash Convergence of Mean-Based Learning Algorithms in First Price Auctions

目前在线广告竞拍中大多采用重复一价拍卖代替过去的二价拍卖。一价拍卖不可信，因此策略选择成为关键。重复博弈的特点使得学习算法可以成为策略选择的工具。本文研究基于均值的学习算法在重复一价拍卖中的收敛情况。本文模型简单，可直接计算证明出均衡，通过模拟实验的方法比对实验结果与均衡，从而印证结论。
内容涉及：重复博弈、在线学习算法、无悔算法、简单模型的均衡计算、学习算法在不同条件下（最高估值参赛者个数）是否会收敛到均衡。
模型：参赛者集合N={1,2,...,n},n≥2N=\{1,2,...,n\},n\ge 2N={1,2,...,n},n≥2。单一卖家拍卖单一物品无限轮次。每位竞价者都对物品有着固定的估值viv^ivi（不随轮次改变）。假设v1≥v2≥...≥vNv^1\ge v^2\ge ... \ge v^Nv1≥v2≥...≥vN。在每一轮t≥1t\ge 1t≥1中，每位竞价者产生竞价bti∈{0,1,...,V}b_t^i\in \{0,1,...,V\}bti∈{0,1,...,V}。竞价最高者得并且支付其竞价，其他人不用支付竞价，如果出现平局情况，则在候选人中随机产生一位胜者。每个人的出价范围是Bi={0,1,...,vi−1}B^i=\{0,1,...,v^i-1\}Bi={0,1,...,vi−1}。竞价者iii的期望效用函数为：（1[bi=maxj∈Nbtj]\bold{1}[b_i=max_{j\in N}b^j_t]1[bi=maxj∈Nbtj]是指当满足中括号内条件时值为1，否则为0；因为是期望收益，所以最后乘以分数表示平局情况）（一价、赢者支付竞价、不同轮次估值相同、不同参赛者估值不同）
ui(bti,bt−i)=(vi−bti)1[bi=maxj∈Nbtj]1∣argmaxj∈Nbtj∣u^i(b_t^i,\bold{b^{-i}_t})=(v^i-b^i_t)\bold{1}[b_i=max_{j\in N}b^j_t]\frac{1}{|argmax_{j\in N}b_t^j|} ui(bti,bt−i)=(vi−bti)1[bi=maxj∈Nbtj]∣argmaxj∈Nbtj∣1
启发：1.本文是重复博弈且非全支付拍卖，与目前研究的核心差距不小；2.对于重复博弈，均衡可以用学习算法去近似（学习算法也不一定收敛于均衡），那么对于复杂模型的一次博弈，有什么方法计算或者近似均衡？3.我们的模型可不可以设计为重复全支付拍卖？4.一次博弈中均衡的建立过程是否类似于重复博弈不断学习、利用经验调整？比如预测2/3。5.重复博弈，是最终轮次更加重要，还是所有轮次的平均更加重要？学习算法可能发散可能收敛，即使收敛结果也不一定收敛于均衡，虽然不是均衡但也代表了博弈的发展趋向，均衡也是用来代表博弈的发展趋向，二者有何区别？

2.Designing an optimal contest

非凹CSF可能存在合谋，不利于设计者最大化利益，因此我们考虑凹CSF。本文提出定理，在某种条件下可以为所有的凹CSF找到等价线性CSF来替代，从而简化了分析计算。在简化后的线性CSF上可以很容易计算出均衡进而求解最优竞赛设计。本文的结论具体精准，只要确定竞赛的相关参数，便可以套用公式计算出：参赛者均衡分数、最优CSF参数、设计者的期望收益。
模型：设想一个竞赛nnn位参赛者共同竞争一个价值为VVV的奖项，并且假设竞赛设计者对奖项有V0V_0V0的估值。参赛者iii选择的分数是xi≥0x_i\ge 0xi≥0，构成分数向量(x1,...,xn)(x_1,...,x_n)(x1,...,xn)。参赛者iii的获胜概率定义为：
Pi(x1,...,xn)=h(xi)s+∑j=1nh(xj)P_i(x_1,...,x_n)=\frac{h(x_i)}{s+\sum_{j=1}^n h(x_j)} Pi(x1,...,xn)=s+∑j=1nh(xj)h(xi)
参赛者iii选择分数xix_ixi，其获胜的可能性对应是h(xi)h(x_i)h(xi)。竞赛设计者不将奖项分配给任何一位参赛者的可能性是s≥0s\ge 0s≥0。那么参赛者iii的期望收益表示为：
πi(x1,...,xn)=Pi(x1,...,xn)V−xi=Vh(xi)s+h(xi)+∑j≠ihj−xi\pi_i(x_1,...,x_n)=P_i(x_1,...,x_n)V-x_i=\frac{Vh(x_i)}{s+h(x_i)+\sum_{j\neq i}h_j}-x_i πi(x1,...,xn)=Pi(x1,...,xn)V−xi=s+h(xi)+∑j=ihjVh(xi)−xi
该模型特点可总结为：1.奖项采取比例分配制。2.选择分数与权重之间存在映射函数h()h()h()。3.每位参赛者都需要支付自己所选择分数的代价（类似All-Pay）。4.所有参赛者对于奖项估值相同。5.设计者也存在奖项估值，因此存在奖项不分配的概率。
启发：1.创新性考虑设计者的估值，其他所有文章中都未曾涉及。但总觉得不太合适，设计者估值存在的意义是可能不会将奖项分配给任何一个人。其实其他模型中的奖项制备代价也可以体现这一点。

3.Optimal rewards in contests

本文关注于竞赛中最优奖励的设计，该竞赛是不完全信息的，并且设计者安排的奖励与参赛者付出的努力相关。参赛者已知自己类型与公共的类型分布后，选择分数以最大化胜利概率，从而产生均衡。设计者由均衡的努力情况反推参赛者分布，结合分布设计最优奖励。使用该方法分析了total-mult、total-add、highest-mult、highest-add、多奖项竞赛等情况。核心结论总结如下图：
最有趣的发现在于：有违于常理，在某些情况下，R′(x)<0R'(x)<0R′(x)<0，也就是说努力程度越大，获得的奖励却越少。
本文采取间接的方法来求解最优奖励。均衡中分数选择与类型相关，即θ(x)\theta(x)θ(x)；其反函数x(θ)x(\theta)x(θ)理解为：根据均衡策略反推其类型；最优奖励是均衡分数选择的函数即R(x)R(x)R(x)，但需要结合θ(x)\theta(x)θ(x)来求解。本文四种情况下都给出了具体的求解公式。
模型：考虑一个nnn位参赛者参与且奖项与努力有关地全支付竞赛。每位参赛者的类型都独立同分布于[θ‾,θˉ][\underline{\theta},\bar{\theta}][θ,θˉ]，累计分布函数为FFF且为公共已知信息。代价函数为c(θi,xi)c(\theta_i,x_i)c(θi,xi)随着θ\thetaθ而递减，随着xix_ixi而递增，且c(θ,0)=0,limx→∞c(θ,x)=∞c(\theta,0)=0,lim_{x\rightarrow \infty}c(\theta,x)=\inftyc(θ,0)=0,limx→∞c(θ,x)=∞。
拥有最高努力的参赛者iii获得奖励R(xi)R(x_i)R(xi)，其胜利效用为V(θ,R(xi))V(\theta,R(x_i))V(θ,R(xi))。换句话说，获胜者获得的奖励与其努力程度相关，胜利效用不单单与奖励相关，还与其类型相关。考虑胜利效用的两种形式：mult形式：V(θ,R(xi))=θ⋅R(xi)V(\theta,R(x_i))=\theta \cdot R(x_i)V(θ,R(xi))=θ⋅R(xi)，代表了胜利的金钱效用与类型有关，比如科研竞赛；add形式：V(θ,R(xi))=θ+R(xi)V(\theta,R(x_i))=\theta + R(x_i)V(θ,R(xi))=θ+R(xi)，代表有独立于金钱效用的一部分胜利效用，比如名望、地位等与金钱无关，比如体育竞赛。（代价函数c(θi,xi)c(\theta_i,x_i)c(θi,xi)，胜利效用V(θ,R(xi))V(\theta,R(x_i))V(θ,R(xi))，胜利效用中θ\thetaθ与R(xi)R(x_i)R(xi)也有两种关联方式：乘法与加法，设计者目标函数有两种。）
本文模型设计较为奇怪，类型与代价函数、胜利效用函数的耦合很深，很少见到这样的模型。

4.Asymmetric All-Pay Auctions with Incomplete Information:The Two-Player Case

不完全信息的非对称全支付拍卖。证明了均衡的存在性与唯一性。（大篇幅的证明过程，无明显结论，结论与证明过程彼此融合，非常抽象）

5.Asymmetric All-Pay Auctions with Two Types

不完全信息的非对称全支付拍卖。证明了均衡的存在性与唯一性。（大篇幅的证明过程，无明显结论，结论与证明过程彼此融合，非常抽象）
模型：全支付拍卖中有222个竞价者，胜利估值都是111。概率为pi∈(0,1)p_i\in(0,1)pi∈(0,1)，竞价者iii属于强类型，拥有较低的边际代价cic_ici；概率为1−pi1-p_i1−pi，竞价者iii属于弱类型，拥有较高的边际代价CiC_iCi。我们假设ci<Ci<∞c_i<C_i<\inftyci<Ci<∞。概率分布是公共已知的，每位竞价者只知道自己的类型而不知道对手的。参赛者的期望收益是Pi(e)−cieP_i(e)-c_iePi(e)−cie或Pi(e)−CieP_i(e)-C_iePi(e)−Cie。

6.All-pay auctions—an experimental study

这篇文章汇报了关于重复全支付拍卖博弈的一些结论。所使用的拍卖形式尽可能简单，完全信息、完美响应以及公共估值。我们主要地发现是在这样的拍卖中，过高出价是非常激烈的，并且在早期阶段卖家的收益强依赖于竞价者地个数。然而过了几轮博弈之后，这种依赖性完全消失并且卖家的收益变成独立于参赛者的个数。这些结果面对与两个经济理论的概念，纳什均衡与对称Logit均衡。
重复全支付拍卖；模型非常简单：完全信息、完美响应、公共估值、对称；观察Over-biding的现象；实验结果表明前几轮设计者收益与参赛者个数相关，之后轮次呈现无关；纳什均衡理论与Logit均衡理论都无法很好解释现象。真人实验而非模拟实验。
本文模型与经典的All-Pay Contests非常像，本来以为这是一篇使用计算机做模拟实验的文章呢。

7.后续

后续我也找了一些用算法去计算/近似均衡的文章，也都是在All-Pay的模型下，还没来得及看。所以我的初步设想是，找一篇现在有完整均衡求解推理的文章，然后利用模拟实验的方法去验证是否符合均衡；设计一个相对复杂的设定，用模拟实验的方法去近似均衡。

近期几篇有关All-Pay论文总结（博弈论+机制设计）相关推荐

Wisdom of the Crowd Voting：Truthful Aggregation of Voter Information and Preference（博弈论+机制设计）论文阅读笔记
Wisdom of the Crowd Voting:Truthful Aggregation of Voter Information and Preferences 论文阅读笔记一.基本信息二 ...
Designing an optimal contest（博弈论+机制设计）论文阅读笔记
Designing an optimal contest 论文阅读笔记一.基本信息二.文章摘要三.背景介绍四.核心模型五.核心结论六.总结展望一.基本信息题目:设计一个最优竞赛作者: ...
Peer pressure in extortion game can resolve social dilemma（博弈论+机制设计）论文阅读笔记
Peer pressure in extortion game can resolve social dilemma 论文阅读笔记一.基本信息二.文章摘要三.核心模型四.分析过程五.论文总结 ...
一文看尽10篇目标检测最新论文（SpineNet/AugFPN/LRF-Net/SABL/DSFPN等）
点击上方"CVer",选择加"星标"或"置顶" 重磅干货,第一时间送达前言一周前 Amusi 整理了目标检测(Object Detec ...
1210篇新冠肺炎论文文献合集整理，附论文原文地址（合集）
1210篇新冠肺炎论文文献整理,附论文原文地址(合集) 近期国内的新冠肺炎得到了一定的好转,但是相关的研究和治疗方向一直没有一个明确的说法.我在搜索相关文献时,发现了一个新冠肺炎相关文献的合集.在这里 ...
如何写一篇好的科研论文
背景近期在整理一些文档,发现了去年去参加ICCV 2019的时候,Facebook AI 的 Ross Girshick 做了一个关于目标检测和实例分割的 tutorial,最后用19页PPT讲解了 ...
怎么发表一篇教育类的论文
怎么发表一篇教育类的论文?对于许多教育工作者来说,都会想将自己平时的教育经验,研究项目和教育理论发表.这样不但对自己是一个提升,同时对教育工作来说也是有利的.那么我们该如何发表我们的教育论文呢? 1. ...
Github热榜：2021年33篇最酷AI论文综述！多位华人作者入选
新智元报道编辑:小咸鱼 [新智元导读]GitHub上,有一位小哥放出了「2021年充满惊喜的人工智能论文综述」这个项目.目前,里面总结了33篇今年必看论文,堪称「良心宝藏」.这个项目仍在更新 ...
“深度学习”这十年：52篇大神级论文再现AI荣与光
来源:新智元本文约4100字,建议阅读6分钟从"深度学习三巨头"到何恺明,从谷歌到MIT,52篇神级论文带大家回顾深度学习这十年. [ 导读 ]从自动驾驶到Deepfake,深 ...
一文看尽10篇目标检测最新论文（MetaOD/P-RSDet/MatrixNets等）
前言恰逢 2020年,本文再次更新近期值得关注的最新检测论文.这次分享的paper将同步推送到 github上,欢迎大家 star/fork(点击阅读原文,也可直接访问): https://gith ...

近期几篇有关All-Pay论文总结（博弈论+机制设计）

近期几篇有关All-Pay论文总结

1.Nash Convergence of Mean-Based Learning Algorithms in First Price Auctions

2.Designing an optimal contest

3.Optimal rewards in contests

4.Asymmetric All-Pay Auctions with Incomplete Information:The Two-Player Case

5.Asymmetric All-Pay Auctions with Two Types

6.All-pay auctions—an experimental study

7.后续

近期几篇有关All-Pay论文总结（博弈论+机制设计）相关推荐

最新文章

热门文章