近期几篇有关All-Pay论文总结

  • 1.Nash Convergence of Mean-Based Learning Algorithms in First Price Auctions
  • 2.Designing an optimal contest
  • 3.Optimal rewards in contests
  • 4.Asymmetric All-Pay Auctions with Incomplete Information:The Two-Player Case
  • 5.Asymmetric All-Pay Auctions with Two Types
  • 6.All-pay auctions—an experimental study
  • 7.后续

1.Nash Convergence of Mean-Based Learning Algorithms in First Price Auctions

  • 目前在线广告竞拍中大多采用重复一价拍卖代替过去的二价拍卖。一价拍卖不可信,因此策略选择成为关键。重复博弈的特点使得学习算法可以成为策略选择的工具。本文研究基于均值的学习算法在重复一价拍卖中的收敛情况。本文模型简单,可直接计算证明出均衡,通过模拟实验的方法比对实验结果与均衡,从而印证结论。
  • 内容涉及:重复博弈、在线学习算法、无悔算法、简单模型的均衡计算、学习算法在不同条件下(最高估值参赛者个数)是否会收敛到均衡。
  • 模型:参赛者集合N={1,2,...,n},n≥2N=\{1,2,...,n\},n\ge 2N={1,2,...,n},n≥2。单一卖家拍卖单一物品无限轮次。每位竞价者都对物品有着固定的估值viv^ivi(不随轮次改变)。假设v1≥v2≥...≥vNv^1\ge v^2\ge ... \ge v^Nv1≥v2≥...≥vN。在每一轮t≥1t\ge 1t≥1中,每位竞价者产生竞价bti∈{0,1,...,V}b_t^i\in \{0,1,...,V\}bti​∈{0,1,...,V}。竞价最高者得并且支付其竞价,其他人不用支付竞价,如果出现平局情况,则在候选人中随机产生一位胜者。每个人的出价范围是Bi={0,1,...,vi−1}B^i=\{0,1,...,v^i-1\}Bi={0,1,...,vi−1}。竞价者iii的期望效用函数为:(1[bi=maxj∈Nbtj]\bold{1}[b_i=max_{j\in N}b^j_t]1[bi​=maxj∈N​btj​]是指当满足中括号内条件时值为1,否则为0;因为是期望收益,所以最后乘以分数表示平局情况)(一价、赢者支付竞价、不同轮次估值相同、不同参赛者估值不同)
    ui(bti,bt−i)=(vi−bti)1[bi=maxj∈Nbtj]1∣argmaxj∈Nbtj∣u^i(b_t^i,\bold{b^{-i}_t})=(v^i-b^i_t)\bold{1}[b_i=max_{j\in N}b^j_t]\frac{1}{|argmax_{j\in N}b_t^j|} ui(bti​,bt−i​)=(vi−bti​)1[bi​=maxj∈N​btj​]∣argmaxj∈N​btj​∣1​
  • 启发:1.本文是重复博弈且非全支付拍卖,与目前研究的核心差距不小;2.对于重复博弈,均衡可以用学习算法去近似(学习算法也不一定收敛于均衡),那么对于复杂模型的一次博弈,有什么方法计算或者近似均衡?3.我们的模型可不可以设计为重复全支付拍卖?4.一次博弈中均衡的建立过程是否类似于重复博弈不断学习、利用经验调整?比如预测2/3。5.重复博弈,是最终轮次更加重要,还是所有轮次的平均更加重要?学习算法可能发散可能收敛,即使收敛结果也不一定收敛于均衡,虽然不是均衡但也代表了博弈的发展趋向,均衡也是用来代表博弈的发展趋向,二者有何区别?

2.Designing an optimal contest

  • 非凹CSF可能存在合谋,不利于设计者最大化利益,因此我们考虑凹CSF。本文提出定理,在某种条件下可以为所有的凹CSF找到等价线性CSF来替代,从而简化了分析计算。在简化后的线性CSF上可以很容易计算出均衡进而求解最优竞赛设计。本文的结论具体精准,只要确定竞赛的相关参数,便可以套用公式计算出:参赛者均衡分数、最优CSF参数、设计者的期望收益。
  • 模型:设想一个竞赛nnn位参赛者共同竞争一个价值为VVV的奖项,并且假设竞赛设计者对奖项有V0V_0V0​的估值。参赛者iii选择的分数是xi≥0x_i\ge 0xi​≥0,构成分数向量(x1,...,xn)(x_1,...,x_n)(x1​,...,xn​)。参赛者iii的获胜概率定义为:
    Pi(x1,...,xn)=h(xi)s+∑j=1nh(xj)P_i(x_1,...,x_n)=\frac{h(x_i)}{s+\sum_{j=1}^n h(x_j)} Pi​(x1​,...,xn​)=s+∑j=1n​h(xj​)h(xi​)​
    参赛者iii选择分数xix_ixi​,其获胜的可能性对应是h(xi)h(x_i)h(xi​)。竞赛设计者不将奖项分配给任何一位参赛者的可能性是s≥0s\ge 0s≥0。那么参赛者iii的期望收益表示为:
    πi(x1,...,xn)=Pi(x1,...,xn)V−xi=Vh(xi)s+h(xi)+∑j≠ihj−xi\pi_i(x_1,...,x_n)=P_i(x_1,...,x_n)V-x_i=\frac{Vh(x_i)}{s+h(x_i)+\sum_{j\neq i}h_j}-x_i πi​(x1​,...,xn​)=Pi​(x1​,...,xn​)V−xi​=s+h(xi​)+∑j​=i​hj​Vh(xi​)​−xi​
    该模型特点可总结为:1.奖项采取比例分配制。2.选择分数与权重之间存在映射函数h()h()h()。3.每位参赛者都需要支付自己所选择分数的代价(类似All-Pay)。4.所有参赛者对于奖项估值相同。5.设计者也存在奖项估值,因此存在奖项不分配的概率。
  • 启发:1.创新性考虑设计者的估值,其他所有文章中都未曾涉及。但总觉得不太合适,设计者估值存在的意义是可能不会将奖项分配给任何一个人。其实其他模型中的奖项制备代价也可以体现这一点。

3.Optimal rewards in contests

  • 本文关注于竞赛中最优奖励的设计,该竞赛是不完全信息的,并且设计者安排的奖励与参赛者付出的努力相关。参赛者已知自己类型与公共的类型分布后,选择分数以最大化胜利概率,从而产生均衡。设计者由均衡的努力情况反推参赛者分布,结合分布设计最优奖励。使用该方法分析了total-mult、total-add、highest-mult、highest-add、多奖项竞赛等情况。核心结论总结如下图:
    最有趣的发现在于:有违于常理,在某些情况下,R′(x)<0R'(x)<0R′(x)<0,也就是说努力程度越大,获得的奖励却越少。
  • 本文采取间接的方法来求解最优奖励。均衡中分数选择与类型相关,即θ(x)\theta(x)θ(x);其反函数x(θ)x(\theta)x(θ)理解为:根据均衡策略反推其类型;最优奖励是均衡分数选择的函数即R(x)R(x)R(x),但需要结合θ(x)\theta(x)θ(x)来求解。本文四种情况下都给出了具体的求解公式。
  • 模型:考虑一个nnn位参赛者参与且奖项与努力有关地全支付竞赛。每位参赛者的类型都独立同分布于[θ‾,θˉ][\underline{\theta},\bar{\theta}][θ​,θˉ],累计分布函数为FFF且为公共已知信息。代价函数为c(θi,xi)c(\theta_i,x_i)c(θi​,xi​)随着θ\thetaθ而递减,随着xix_ixi​而递增,且c(θ,0)=0,limx→∞c(θ,x)=∞c(\theta,0)=0,lim_{x\rightarrow \infty}c(\theta,x)=\inftyc(θ,0)=0,limx→∞​c(θ,x)=∞。
    拥有最高努力的参赛者iii获得奖励R(xi)R(x_i)R(xi​),其胜利效用为V(θ,R(xi))V(\theta,R(x_i))V(θ,R(xi​))。换句话说,获胜者获得的奖励与其努力程度相关,胜利效用不单单与奖励相关,还与其类型相关。考虑胜利效用的两种形式:mult形式:V(θ,R(xi))=θ⋅R(xi)V(\theta,R(x_i))=\theta \cdot R(x_i)V(θ,R(xi​))=θ⋅R(xi​),代表了胜利的金钱效用与类型有关,比如科研竞赛;add形式:V(θ,R(xi))=θ+R(xi)V(\theta,R(x_i))=\theta + R(x_i)V(θ,R(xi​))=θ+R(xi​),代表有独立于金钱效用的一部分胜利效用,比如名望、地位等与金钱无关,比如体育竞赛。(代价函数c(θi,xi)c(\theta_i,x_i)c(θi​,xi​),胜利效用V(θ,R(xi))V(\theta,R(x_i))V(θ,R(xi​)),胜利效用中θ\thetaθ与R(xi)R(x_i)R(xi​)也有两种关联方式:乘法与加法,设计者目标函数有两种。)
  • 本文模型设计较为奇怪,类型与代价函数、胜利效用函数的耦合很深,很少见到这样的模型。

4.Asymmetric All-Pay Auctions with Incomplete Information:The Two-Player Case

  • 不完全信息的非对称全支付拍卖。证明了均衡的存在性与唯一性。(大篇幅的证明过程,无明显结论,结论与证明过程彼此融合,非常抽象)

5.Asymmetric All-Pay Auctions with Two Types

  • 不完全信息的非对称全支付拍卖。证明了均衡的存在性与唯一性。(大篇幅的证明过程,无明显结论,结论与证明过程彼此融合,非常抽象)
  • 模型:全支付拍卖中有222个竞价者,胜利估值都是111。概率为pi∈(0,1)p_i\in(0,1)pi​∈(0,1),竞价者iii属于强类型,拥有较低的边际代价cic_ici​;概率为1−pi1-p_i1−pi​,竞价者iii属于弱类型,拥有较高的边际代价CiC_iCi​。我们假设ci<Ci<∞c_i<C_i<\inftyci​<Ci​<∞。概率分布是公共已知的,每位竞价者只知道自己的类型而不知道对手的。参赛者的期望收益是Pi(e)−cieP_i(e)-c_iePi​(e)−ci​e或Pi(e)−CieP_i(e)-C_iePi​(e)−Ci​e。

6.All-pay auctions—an experimental study

  • 这篇文章汇报了关于重复全支付拍卖博弈的一些结论。所使用的拍卖形式尽可能简单,完全信息、完美响应以及公共估值。我们主要地发现是在这样的拍卖中,过高出价是非常激烈的,并且在早期阶段卖家的收益强依赖于竞价者地个数。然而过了几轮博弈之后,这种依赖性完全消失并且卖家的收益变成独立于参赛者的个数。这些结果面对与两个经济理论的概念,纳什均衡与对称Logit均衡。
  • 重复全支付拍卖;模型非常简单:完全信息、完美响应、公共估值、对称;观察Over-biding的现象;实验结果表明前几轮设计者收益与参赛者个数相关,之后轮次呈现无关;纳什均衡理论与Logit均衡理论都无法很好解释现象。真人实验而非模拟实验。
  • 本文模型与经典的All-Pay Contests非常像,本来以为这是一篇使用计算机做模拟实验的文章呢。

7.后续

  • 后续我也找了一些用算法去计算/近似均衡的文章,也都是在All-Pay的模型下,还没来得及看。所以我的初步设想是,找一篇现在有完整均衡求解推理的文章,然后利用模拟实验的方法去验证是否符合均衡;设计一个相对复杂的设定,用模拟实验的方法去近似均衡。

近期几篇有关All-Pay论文总结(博弈论+机制设计)相关推荐

  1. Wisdom of the Crowd Voting:Truthful Aggregation of Voter Information and Preference(博弈论+机制设计) 论文阅读笔记

    Wisdom of the Crowd Voting:Truthful Aggregation of Voter Information and Preferences 论文阅读笔记 一.基本信息 二 ...

  2. Designing an optimal contest(博弈论+机制设计) 论文阅读笔记

    Designing an optimal contest 论文阅读笔记 一.基本信息 二.文章摘要 三.背景介绍 四.核心模型 五.核心结论 六.总结展望 一.基本信息 题目:设计一个最优竞赛 作者: ...

  3. Peer pressure in extortion game can resolve social dilemma(博弈论+机制设计) 论文阅读笔记

    Peer pressure in extortion game can resolve social dilemma 论文阅读笔记 一.基本信息 二.文章摘要 三.核心模型 四.分析过程 五.论文总结 ...

  4. 一文看尽10篇目标检测最新论文(SpineNet/AugFPN/LRF-Net/SABL/DSFPN等)

    点击上方"CVer",选择加"星标"或"置顶" 重磅干货,第一时间送达 前言 一周前 Amusi 整理了 目标检测(Object Detec ...

  5. 1210篇新冠肺炎论文文献合集整理,附论文原文地址(合集)

    1210篇新冠肺炎论文文献整理,附论文原文地址(合集) 近期国内的新冠肺炎得到了一定的好转,但是相关的研究和治疗方向一直没有一个明确的说法.我在搜索相关文献时,发现了一个新冠肺炎相关文献的合集.在这里 ...

  6. 如何写一篇好的科研论文

    背景 近期在整理一些文档,发现了去年去参加ICCV 2019的时候,Facebook AI 的 Ross Girshick 做了一个关于目标检测和实例分割的 tutorial,最后用19页PPT讲解了 ...

  7. 怎么发表一篇教育类的论文

    怎么发表一篇教育类的论文?对于许多教育工作者来说,都会想将自己平时的教育经验,研究项目和教育理论发表.这样不但对自己是一个提升,同时对教育工作来说也是有利的.那么我们该如何发表我们的教育论文呢? 1. ...

  8. Github热榜:2021年33篇最酷AI论文综述!多位华人作者入选

      新智元报道   编辑:小咸鱼 [新智元导读]GitHub上,有一位小哥放出了「2021年充满惊喜的人工智能论文综述」这个项目.目前,里面总结了33篇今年必看论文,堪称「良心宝藏」.这个项目仍在更新 ...

  9. “深度学习”这十年:52篇大神级论文再现AI荣与光

    来源:新智元 本文约4100字,建议阅读6分钟 从"深度学习三巨头"到何恺明,从谷歌到MIT,52篇神级论文带大家回顾深度学习这十年. [ 导读 ]从自动驾驶到Deepfake,深 ...

  10. 一文看尽10篇目标检测最新论文(MetaOD/P-RSDet/MatrixNets等)

    前言 恰逢 2020年,本文再次更新近期值得关注的最新检测论文.这次分享的paper将同步推送到 github上,欢迎大家 star/fork(点击阅读原文,也可直接访问): https://gith ...

最新文章

  1. Active Directory数据库复制原理
  2. 左右HttpClient上传的方法来解决中国的乱码
  3. Ubuntu最简单的方式安装NVIDIA显卡驱动和cuda工具
  4. keil MDK中如何生成*.bin格式的文件
  5. MySQL中的锁机制-全局锁/表锁/行锁
  6. js 控制 head 元素 隐藏与显示
  7. [LeetCode]129. Sum Root to Leaf Numbers路径数字求和
  8. 高速信号传输约翰逊 pdf_?高速滑环生产加工问题的具体分析
  9. linux安装mysql phpmyadmin_如何在Linux下安装和配置PHPmyadmin?
  10. 软件研发管理体系建设
  11. 十六种CAD.CAE.CAM软件介绍
  12. ffmpeg转换视频编码
  13. 形式语言与自动机总结笔记
  14. ubuntu 20.10 安装万能五笔(ibus模式)
  15. Tier2 上1K Node的准备
  16. BCH分叉影响深远 业内外热议不断
  17. 计算机打音乐歌谱成都,赵雷成都的曲谱
  18. 关联性——相关性分析
  19. IPV4服务器如何支持ipv6访问
  20. burp suite抓包中文乱码

热门文章

  1. 故障分析 | OceanBase Proxy 无法连接 OBserver 集群
  2. 如何打印网上的文章资料,网上文章怎么打印
  3. 《我是一只IT小小鸟》(胡江堂主编)读后感
  4. Android2018年最新前沿框架和技术
  5. Python课第3周:平方根格式化
  6. 【推荐系统】:协同过滤和基于内容过滤概述
  7. 北京爷们儿跟北京妞儿 倍儿靠谱儿-----女人篇
  8. win8系统用友U8服务器的设置,用友u8服务器参数配置
  9. 计算机 系统 声音问题 有回声
  10. WireShark基本使用(5)第 5 章 文件输入/输出及打印