Wisdom of the Crowd Voting:Truthful Aggregation of Voter Information and Preference(博弈论+机制设计) 论文阅读笔记
Wisdom of the Crowd Voting:Truthful Aggregation of Voter Information and Preferences 论文阅读笔记
- 一、基本信息
- 二、文章摘要
- 三、核心模型
- 四、分析方法
一、基本信息
- 题目:群众投票的智慧:真实可信地汇聚投票者的信息与偏好
- 作者:Grant Schoenebeck,Biaoshuai Tao
二、文章摘要
- 以下内容取自原文摘要部分:
我们考虑两个候选人的选举,其中投票者的偏好取决于一个不可直接观察的状态变量。每个投票者接收到一个与状态变量相关的私人信号。投票者可能是“视情况而定”的,也就是说不同状态下偏好不同,也有可能是“事先注定”的,不同状态下有相同偏好。在这种设定下,即便每个投票者都是视情况而定的,代理者依据私人信息投票并不一定导致普遍偏好的候选者胜出,这是因为信号可能存在系统偏差。我们提出一种易于部署的机制去引出并汇聚投票者的私人信号,并且输出被绝大多数投票者偏好的候选者。具体来说,投票者真实汇报自己的信号从而形成强贝叶斯那时均衡(没有任何一个投票者组合策略偏移可以获得更大收益)。 - 简要来说:一般社会选择机制可能存在谎报获利的情况,因此机制无法直接体现群体的多数偏好。本文的目的即设计机制使得真实策略成为(强)贝叶斯纳什均衡,机制能够真实可信地收集群体的信息与偏好。
三、核心模型
- 方便理解,创设情境:假设某个公司有TTT名成员,或者说是代理者,需要决定是否雇佣一个新的公司成员。每位代理者的投票只有两种可能AAA是接受,BBB是拒绝。
- 使用{L,H}\{L,H\}{L,H}衡量该候选者的潜在品质,LLL代表低品质,HHH代表高品质。代理者们不知道候选者的真实品质WWW(如果知道了肯定就作出必然决策了),但通过阅读候选者简历可以形成一个公共先验信念(PL,PH)=(Pr(W=L),Pr(W=H))(P_L,P_H)=(Pr(W=L),Pr(W=H))(PL,PH)=(Pr(W=L),Pr(W=H))(所有代理者已知)。
- 每位代理者都会跟候选者单独进行一场面试,面试过后代理者ttt都会得到一个信号StS_tSt(可取值l,hl,hl,h)。假设所有代理者在确定真实品质情况下获得的信号服从相同分布并且独立。PlL=Pr(St=l∣W=L)P_{lL}=Pr(S_t=l|W=L)PlL=Pr(St=l∣W=L)表示候选者真实品质为LLL的前提下,任意一个代理者面试后获得lll信号的概率。信号的获取与真实品质有关。高品质获得高评价概率更大,低品质获得低评价概率更大。
PlL>PlH,PhH>PhLP_{lL}>P_{lH},P_{hH}>P_{hL} PlL>PlH,PhH>PhL - 根据贝叶斯思想,代理者收到面试评价结合先验信念,生成后验信念,也就是说更新了自己对于候选者隶属于高品质、低品质的概率。不同代理者可能对于接收有着不同的门槛,或者说接收某个候选者对于代理者来说有着不同的效用。但对于任意代理者ttt来说,接收一定是接受高品质候选者效用更高,拒绝一定是拒绝低品质者效用更高。效用函数结合后验分布,代理者选择最优决策即可。
vt(H,A)>vt(L,A),vt(H,R)<vt(L,R)v_t(H,A)>v_t(L,A),v_t(H,R)<v_t(L,R) vt(H,A)>vt(L,A),vt(H,R)<vt(L,R) - 接下来我们陈述三种不同的投票者。投票者种类FFF总是倾向于接收,比例为αF=∣F∣∣T∣\alpha_F=\frac{|F|}{|T|}αF=∣T∣∣F∣;投票者种类UUU总是倾向于拒绝,比例为αU=∣U∣∣T∣\alpha_U=\frac{|U|}{|T|}αU=∣T∣∣U∣;投票者种类CCC视候选者品质而定(高品质更倾向于接收,低品质更倾向于拒绝),比例为αC=∣C∣∣T∣\alpha_C=\frac{|C|}{|T|}αC=∣T∣∣C∣。三种不同种类投票者的比例是公共信息。三种不同类型投票者的效用函数比较如下:
F:vt(H,A)>vt(L,A)>vt(L,R)>vt(H,R)U:vt(L,R)>vt(H,R)>vt(H,A)>vt(L,A)C:vt(L,R)>vt(L,A),vt(H,A)>vt(H,R)F:v_t(H,A)>v_t(L,A)>v_t(L,R)>v_t(H,R)\\ U:v_t(L,R)>v_t(H,R)>v_t(H,A)>v_t(L,A)\\ C:v_t(L,R)>v_t(L,A),v_t(H,A)>v_t(H,R) F:vt(H,A)>vt(L,A)>vt(L,R)>vt(H,R)U:vt(L,R)>vt(H,R)>vt(H,A)>vt(L,A)C:vt(L,R)>vt(L,A),vt(H,A)>vt(H,R) - 投票机制的目的是为了输出多数者意愿,也就是说选择出半数以上投票者真正偏好的候选项。假设TTT是奇数。如果αF>1/2\alpha_F>1/2αF>1/2,那么直接输出接受AAA;如果αU>1/2\alpha_U>1/2αU>1/2,那么直接输出拒绝RRR;如果αF,αU<1/2\alpha_F,\alpha_U<1/2αF,αU<1/2,那么决定权在于CCC手上,因其无论统一投给哪一方,该方都会过半数而获胜,CCC的投票结果由候选人的真实品质决定,真实品质为HHH,结果为AAA,真实品质为LLL,结果为RRR。
- 结束以上情景的介绍,该情景只是用来方便描述设定,其实该情景可以类似转化应用在很多种实际情况中。比如下面将该情景转化为两候选者的竞选问题。面试情景中的A,RA,RA,R可以对应到投票给a,ba,ba,b,L,HL,HL,H可以分别表示为a/ba/ba/b更适合,信号可以来源于电视、报纸等媒体对于候选者的报道,F,U,CF,U,CF,U,C分别表示坚定支持aaa、坚定支持bbb、摇摆型投票者。
四、分析方法
- 投票者向中心提交报告,机制中心收集报告,并且输出最终投票结果。RRR为报告的可能空间,纯策略是σ:S→R\sigma:S\rightarrow Rσ:S→R,投票者收到信号决定向中心提交怎样的报告,在混合策略中,σ\sigmaσ可以是随机函数。
- 本篇文章是一个社会选择问题,基于参与者十分庞大的设定,因此可能单一参与者策略的改变不会影响整体结果,因此一般的贝叶斯纳什均衡在这里就不再适用。我们使用一个更加强大的目标:强贝叶斯纳什均衡 strong Bayes Nash Equilibrium。
ϵ\epsilonϵ-strong Bayes Nash equilbrium
如果一个策略组合(α1,...,αT)(\alpha_1,...,\alpha_T)(α1,...,αT),如果不存在一个代理者子集DDD以及一个策略组合(α1′,...,αT′)(\alpha_1',...,\alpha_T')(α1′,...,αT′)符合以下条件,那么是ϵ\epsilonϵ-strong Bayes Nash equilbrium。
1.对于不在叛逃子集内的代理者来说,策略不变。
2.对于所有叛逃子集内的代理者来说,采用叛逃策略组合的效用要大于等于之前的。
3.存在某个叛逃子集内的代理者ttt,其叛逃策略组合下的收益要比之前的大ϵ\epsilonϵ以上。
- 代理者的效用可以表示如下。其中λLR(∑)\lambda_L^R(\sum)λLR(∑)表示输入策略组合∑\sum∑之后,真实类型为L的世界中R胜出的概率,其他的符号便可以以此类推。∑∗={σ1∗,...,σT∗}\sum^*=\{\sigma_1^*,...,\sigma_T^*\}∑∗={σ1∗,...,σT∗}表示真实可信的策略组合。
ut(∑)=PLλLA(∑)ut(L,A)+PLλLR(∑)vt(L,R)+PHλHA(∑)vt(H,A)+PHλHR(∑)vt(H,R)u_t(\sum)=P_L\lambda_L^A(\sum)u_t(L,A)+P_L\lambda_L^R(\sum)v_t(L,R)+P_H\lambda_H^A(\sum)v_t(H,A)+P_H\lambda_H^R(\sum)v_t(H,R) ut(∑)=PLλLA(∑)ut(L,A)+PLλLR(∑)vt(L,R)+PHλHA(∑)vt(H,A)+PHλHR(∑)vt(H,R) - 本文的机制设计一定程度上借鉴了Surprisingly Popular Algorithm,下面展开介绍这个算法。我们令TlhT_{lh}Tlh表示该代理者收到hhh的信号(Tlh=1−ThhT_{lh}=1-T_{hh}Tlh=1−Thh),然后认为另外一个代理者收到lll信号的概率(建模了根据所收到的信号更新真实世界概率的过程)。
Tm′m=PLPmLPLPmL+PHPmHPm′L+PHPmHPLPmL+PHPmHPm′HT_{m'm}=\frac{P_LP_{mL}}{P_LP_{mL}+P_HP_{mH}}P_{m'L}+\frac{P_HP_{mH}}{P_LP_{mL}+P_HP_{mH}}P_{m'H} Tm′m=PLPmL+PHPmHPLPmLPm′L+PLPmL+PHPmHPHPmHPm′H
该算法基于非策略性设定(也就是说最优决策只与自己有关)。每位代理者向中心汇报自己收到的信号,以及后验概率,比如收到信号lll的代理者会汇报(l,Tll)(l,T_{ll})(l,Tll),收到信号hhh的代理者会汇报(h,Tlh)(h,T_{lh})(h,Tlh)。然后中心计算报告收到lll的比例,以及报告TlmT_{lm}Tlm的平均值,如果前者更大那么lll被认为是suprisingly popular并且认为LLL就是真实世界。 - The Wisdom-of-the-Crowd-Voting Mechanism
1.每位代理者ttt向机制中心汇报自己的类型(F,U,C)(F,U,C)(F,U,C)。
2.如果代理者汇报自己类型为FFF,那么他汇报的信号会自动被看作siˉ=h\bar{s_i}=hsiˉ=h;如果代理者汇报自己类型为UUU,那么他汇报的信号会自动被看作siˉ=l\bar{s_i}=lsiˉ=l。(信号的作用是为了让C类型去更新分布,F,UF,UF,U不需要记录信号,即便他们的候选人表现不佳也会坚定支持)
3.让每个汇报类型为CCC的代理者汇报自己对于所有人中报告信号hhh比例的预测,所汇报的预测记作δtˉ\bar{\delta_t}δtˉ。我们设定汇报类型为FFF的δtˉ=0\bar{\delta_t}=0δtˉ=0,汇报类型为UUU的δtˉ=1\bar{\delta_t}=1δtˉ=1。
4.计算所有人汇报预测的中位数δˉ\bar{\delta}δˉ。
5.如果超过半数人报告类型FFF,那么AAA直接胜出。反之亦然。
6.如果汇报自己信号stˉ=h\bar{s_t}=hstˉ=h的比例多于δˉ\bar{\delta}δˉ,那么AAA胜出;反之BBB胜出。
以上机制类似于伪代码,对于有数学以及博弈论功底的人来说比较好理解。但事实上,该机制也是易于部署的,也就是说可以用简单、易于代理者理解的方式应用。对于上述公司聘用职员的问题,可以通过下述问卷实现机制。
- 机制效果:(简略说明)在满足一定条件下,讲真话策略是强贝叶斯纳什均衡的;如果参与者都采取讲真话策略,那么有很大的可能性实现输出多数偏好的目标。
- 未竟工作及未来研究方向:目前停留在超过50%50\%50%的多数制,可以拓展到实际应用中常见的2/32/32/3多数制;该机制目前只能处理两个候选者;需要更多的社会实验去验证机制的可行性与正确性。
Wisdom of the Crowd Voting:Truthful Aggregation of Voter Information and Preference(博弈论+机制设计) 论文阅读笔记相关推荐
- Learning from Synthetic Data for Crowd Counting in the Wild 论文阅读笔记
Learning from Synthetic Data for Crowd Counting in the Wild 论文阅读笔记 发表:CVPR 2019 人群计数任务在多变的环境,大范围的人群中 ...
- 【论文阅读笔记】Efficient and Secure Federated Learning With Verifiable Weighted Average Aggregation
个人阅读笔记,若有错误欢迎指正 期刊:2023 TNSE 论文链接: Efficient and Secure Federated Learning With Verifiable Weighted ...
- Weakly-Supervised Crowd Counting Learns from Sorting rather than Locations 论文阅读笔记
弱监督人群计数:基于排序而非位置信息 ECCV2020 作者: 中国科学院大学 中国科学院大数据挖掘与知识管理重点实验室 中国科学院智能信息处理重点实验室 意大利-特兰托大学 1.摘要 在人群计数数据 ...
- Recurrence along Depth: Deep Convolutional Neural Networks with Recurrent Layer Aggregation阅读笔记
RLA阅读笔记 (一) Title (二) Summary (三) Research Object (四) Problem Statement (五) Method 5.1 Layer Aggrega ...
- CSI笔记【7】:Crowd Vetting: Rejecting Adversaries via Collaboration with Application to......论文阅读
CSI笔记[7]:Crowd Vetting: Rejecting Adversaries via Collaboration with Application to Multi-Robot Floc ...
- 【论文阅读】【三维目标检测】VoteNet:Deep Hough Voting for 3D Object Detection in Point Clouds
文章目录 Hough Voting VoteNet 网络结构 Voting in Point Clouds Object Proposal and Classification from Votes ...
- GST: Grouped Spatial-Temporal Aggregation for Efficient Action Recognition 论文阅读
Grouped Spatial-Temporal Aggregation for Efficient Action Recognition 要解决的问题:作者对比了Kinetic和Diving48这两 ...
- Crowd Counting领域论文阅读
CrowdNet: A Deep Convolutional Network for Dense Crowd Counting 本文使用 deep and shallow, fully convol ...
- 论文阅读 GA-Net: Guided Aggregation Net for End-to-end Stereo Matching
本论文是CVPR2019收录的文章. 论文链接:https://arxiv.org/pdf/1904.06587v1.pdf GitHub链接:https://github.com/feihuzhan ...
最新文章
- android怎么监听多点触摸_什么是多点触控技术,有哪些用途
- 不用第三方库,也能用 Python 作图,效果还不错
- js小案例:使用location.href自动跳转页面
- ZYAR20A 亚克力2驱 蓝牙 298寻迹避障机器人 —— 安装过程
- Mysql 出现Got error 28 from storage engine
- SAP Spartacus lock focus directive如何判断有没有focusable children
- 一键截图_教你一键为iPhone截图加上手机外壳,新技能快学起来!
- notepad python设置_NotePad++上配置Python
- cmd如何默认以管理身份运行
- 2017 年度编程语言榜,Java 最流行、JavaScript 最没价值?
- 人名和成绩一起排序_excel中怎么让人名和他的成绩一起排序
- 基于MapGuide的在线WebGIS站点介绍
- 计算机c盘中无法搜索文件格式,电脑C盘中programdata文件夹找不到该怎么办
- 4-任务的挂起与解挂
- Python处理2个表格。从源表格中筛选符合条件的数据,写入到dst表格中
- python实现统计一个字符串中出现的字母和该字母出现的次数
- 2.1 內积与欧几里得空间
- 优秀网页翻译:高精度 10MHz GPS 驯服钟 (GPSDO) - Part 1
- Java SE学习之【网络编程JavaSocket】
- postman如何测试php接口_使用postman玩转接口测试
热门文章
- 星空cad批量打印smartbatchplotv5.2.0版本即将更新
- java单词倒序输出_Java实现单词倒序输出
- 使用javaassist创建类和对象
- Widget的基本知识与历史渊源
- html静态网站基于品优购电商购物网站网页设计与实现共计3个页面 html+css+javascript网页设计实例 企业网站制作...
- win10安装程序没有修复计算机,安装Win10系统突然没有声音怎么修复
- vue调用微信扫描条形码
- 获晨晖资本领投的1.5亿元A轮融资,犀思云想为企业用户提供NAAS服务
- 一句话描述计算机网络,一句话经典句子说说
- SwiftUI 导航 NavigationStack NavigationLink navigationDestination