论文精读——基于演化动力学的复杂网络中带阈值雪堆博弈模型研究

  • 亮点
  • 1 摘要
    • 1.1 原文摘要
    • 1.2 译文
  • 2 文献概览
    • 2.1 “雪堆”博弈简介
    • 2.2 研究场景
    • 2.3 解决的问题
    • 2.4 研究步骤概要
  • 3 模型讨论
    • 3.1 Nc>TN_c > TNc​>T
    • 3.2 Nc<TN_c < TNc​<T
  • 4 结果分析
    • 4.1 理论推导
    • 4.2 T的取值对Pc−PdP_c - P_dPc​−Pd​的影响
    • 4.3 总人数N对Pc−PdP_c - P_dPc​−Pd​的影响
  • 5 复杂网络中的动力学
    • 5.1 建模步骤
    • 5.2 单层网络仿真
    • 5.3 双层结构仿真
    • 5.4 N1=N2N_1 = N_2N1​=N2​仿真结果
    • 5.5 N1≠N2N_1 \neq N_2N1​​=N2​仿真结果
  • 6 结论

原文:
Yuying Zhu, Jianlei Zhang, Qinglin Sun, Zengqiang Chen, Evolutionary dy-namics of strategies for threshold snowdrift games on complex networks, Knowledge-Based Systems (2017), doi: 10.1016/j.knosys.2017.05.016

论文精读系列文章
论文精读2——基于模式序列相似度的大数据时间序列预测及其在电力需求中的应用
论文精读1——基于机器学习的越南生活固体废弃物预测

亮点

  • 提出了带有阈值和惩罚的雪堆博弈模型。
  • 建立了双层网络以进行交互建模。
  • 通过设置下限来促进雪堆博弈中的合作。
  • 通过各层之间的互连可以增强网络互惠性。

1 摘要

1.1 原文摘要

The puzzle of altruistic cooperation attracts many concerns of researchers in multiple subjects nowadays.

In this work we establish punishment in the framework of a threshold multiple-player snowdrift game employed as the scenario for the cooperative dilemma problem.

We show by analysis that given this assumption, punishing free riders can significantly influence the evolution dynamics,and the results are driven by the specific components of the punishing rule.

Intriguingly larger thresholds of the game provide a more favorable scenario for the coexistence of the cooperators and defectors under a broad value range of parameters. Furthermore, we provide a two-layer network framework for describing the individual interactions, by extending the threshold snowdrift games to the double-layers networks.

Here, cooperators are best supported on complex networks by applying the threshold, moreover, the interlinks between the two layers are conducive to reinforce the network reciprocity.

1.2 译文

利他主义合作的难题已引起了多个领域研究人员的关注。

在这项工作中,我们在阈值多人雪堆博弈的框架下建立惩罚机制,作为合作困境问题的情境。

通过分析表明,在给定这种假设的情况下,惩罚搭便车者可以显着影响进化动力学,其结果由惩罚规则的特定组成部分驱动。

有趣的是,较大的博弈阈值为合作者和叛逃者在较宽的参数值范围内共存提供了更有利的情况。 此外,我们通过将阈值的雪堆游戏扩展到双层网络,提供了一个用于描述参与者交互的两层网络框架。

这里,通过应用阈值,可以在复杂网络上为合作者提供最佳支持,此外,两层之间的互连链路有利于增强网络互惠性。

2 文献概览

2.1 “雪堆”博弈简介

多人雪堆演化博弈模型,是多人演化博弈理论研究中的经典模型,该模型以铲雪问题为背景,反映了铲雪者和非铲雪者随着时间的推移,通过对铲雪成本、收益和期望值等众多参数的策略博弈, 铲雪者和非铲雪者的位置也在发生相应的变化, 最终趋近于一个稳定状态。
该过程通常用数理统计中的马尔可夫链来描述,其中策略博弈就是愿景驱动规则。对该经典模型的研究可以指导我们如何通过改变上述参数影响的比重来实现对演化博弈过程和结果的调控, 以促进种群中合作行为的发展。
参考文献:
王先甲,夏可.多人雪堆演化博弈在愿景驱动规则下的扩展平均丰度函数[J].系统工程理论与实践,2019,39(05):1128-1136.

2.2 研究场景

Here we consider the N-agent snowdrift games with threshold abounds, where no common benefit is generated unless its cost is shared by a minimum threshold of cooperating players.

N-Agents雪堆博弈,每个代理之间没有共同利益,除非损失的最低阈值被合作参与者所分担。

例如,在一个现实的社会中修建公共水坝(或道路)或狩猎的成本不能由一个人承担,因为一个代理人的能力有限。只要达到完成项目所需的最低门槛,参与和合作的个人越多,他们每个人完成公共项目所需的成本就越少。在这些情况下,一个有效的项目将需要相关人群提供的最少(阈值)捐款才能成功完成该项目。

2.3 解决的问题

We now aim to address this perplexing issue of cooperation in collective actions, by focusing on the role of punishment on defectors in TNSDG.

现在,我们着眼于集中处理惩罚叛逃者在TNSDG中的作用,以解决集体行动中这一令人困惑的合作问题。

通常提供给玩家的策略选择是二元的:合作和拒绝(cooperation and defection)。其中,用C来代表合作,服从公众利益。D代表拒绝,符合当下的私人利益。

本文中,修订后的战略概况包括:选择合作并支付共同成本(合作惩罚),拒绝可能面临惩罚。合作者会支付与雪堆博弈中与贡献相对应的固定成本。同时,将惩罚拒绝者,费用将由合作者平均分配。

2.4 研究步骤概要

  1. 理论分析:基于模仿者动态模型(Replicator Dynamics)进行理论分析。
  2. 分别将TNSDG应用于单个无标度网络和双层网络进行比较。
  3. 结果主要集中在阈值,利他惩罚和与两层网络结构相关的模仿概率如何影响合作的发展。

3 模型讨论

建模N个博弈方,合作者有NcN_cNc​个,叛逃者有N−NcN-N_cN−Nc​个。

每个玩家都可以从移除的雪堆中获得同等的收益,减去与该策略相关的费用。拒绝者会保留自己的份额,并利用他人的贡献。此外,在模型设置中有一个合作伙伴数量的阈值(T),在该阈值之上博弈成功,每个成员都可以使用公有物品。

同时,考虑到一个人的能力是有限的现实,如果合作者的数量不足,那么游戏就无法完成。这里,阈值T表示需要除雪的最小参与方人数。

假设每个叛逃者将遭受合作者施加的惩罚β\betaβ。考虑到叛逃者进行报复在现实社会中很普遍,每个合作者将以α\alphaα的代价惩罚搭便车的人,费用由所有贡献者(NcN_cNc​)共同承担。博弈成功后,每位参与者将会得到b的回报。

(从报复的角度来看,惩罚的成本意味着对实际社会制度中受惩罚的叛逃者的报复。当被惩罚的叛逃者对惩罚者一无所知时,他们可能会随机报复。)

数学模型可表示为:

3.1 Nc>TN_c > TNc​>T

{Pc=b−α+cNcPd=b−β(1-1)\left\{ \begin{aligned} &P_c = b - \frac{\alpha+c}{N_c}\\ &P_d = b - \beta \tag {1-1} \end{aligned} \right.⎩⎨⎧​​Pc​=b−Nc​α+c​Pd​=b−β​(1-1)

这里的参数c代表合作者支付铲除雪堆的成本。每位合作者为公共物品支付cNc\frac{c}{N_c}Nc​c​的费用。而且,每位合作者将要为惩罚搭便车者支付αNc\frac{\alpha}{N_c}Nc​α​的费用。同时,叛逃者将受到惩罚,即收益减少β\betaβ。

3.2 Nc<TN_c < TNc​<T

即贡献者不能承担消除积雪的工作量,在失败的博弈中不断发展,参与者收益模型可表示如下:
{Pc=−cT−αNcPd=−β(1-2)\left\{ \begin{aligned} &P_c = -\frac{c}{T}-\frac{\alpha}{N_c}\\ &P_d = - \beta \tag {1-2} \end{aligned} \right.⎩⎨⎧​​Pc​=−Tc​−Nc​α​Pd​=−β​(1-2)
其中,c/T是是TNSDG中合作者最大成本。在博弈失败的这种情况下,惩罚仍然有效:每个合作者将以α/Nc\alpha/ N_cα/Nc​的代价惩罚叛逃者,因此,每个叛逃者都会受到固定的收益减少。

4 结果分析

4.1 理论推导

略。可见原文。
doi: 10.1016/j.knosys.2017.05.016

4.2 T的取值对Pc−PdP_c - P_dPc​−Pd​的影响

xcx_cxc​表示总体中选择合作策略c的比例。

从本图中,可以得出结论:T太大或太小都会阻碍合作策略的发展。

当合作者在系统中所占的比例很小时,系统将很容易演变为完全叛逃状态,而叛逃者的较小上限将有助于合作者获得更多控制人口的机会。当阈值T过大时,不利于合作战略C的发展。人群中合作者越多(xc>0.6x_c > 0.6xc​>0.6),可以理解的是,系统上的弱监视(较小的T)不能有效地维持协作。

在这种情况下,较低的阈值可以提高合作者的收益。

4.3 总人数N对Pc−PdP_c - P_dPc​−Pd​的影响


很明显,结果证明Pc−PdP_c - P_dPc​−Pd​对从无限人口中选择的个体数目N敏感。

5 复杂网络中的动力学

复杂的网络为找出驱动集体困境中策略发展的内在因素提供了一种至关重要的方法。

两种范例是Baraba´si-Albert(BA)无标度网络(满足幂律度分布)和ER随机网络(符合泊松分布)。

5.1 建模步骤

  1. 将进化博弈的种群结构建模为只有一层的孤立网络。
  2. 逐步考虑了两层相互依存的网络结构。
  3. 此外,我们将在双层BA-BA无标度层与BA-ER网络上比较结果(这两层分别由BA无标度网络和ER随机规则网络建模)。

5.2 单层网络仿真

随机初始化的,位于单层Barab´asi-Albert(BA)无标度网络(包含1000个节点)的个人所扮演策略的演化动力学。

BA网络的平均度< k >设置为8。为参与者提供的策略选择是:C(合作者)和D(拒绝者)。网络上的个人根据以下规则更新其策略:

  • 属于该网络的所有代理都与其所有邻居一起参与TNSDG。
  • 当玩家i更新其策略时,将随机选择其邻居j之一。
  • 计算代理i和j的收益PiP_iPi​和PjP_jPj​。
  • 最后,玩家i根据以下过渡概率更新其策略:
    pij=11+eλ(pi−pj)(1-3)p_{ij} = \frac{1}{1+e^{\lambda(p_i-p_j)}}\tag {1-3}pij​=1+eλ(pi​−pj​)1​(1-3)

其中,λ\lambdaλ代表了战略采用过程中的不确定性。
当λ→0,\lambda \rightarrow 0,λ→0,选择收益更高的策略的概率为0.5。当λ→∞\lambda \rightarrow \inftyλ→∞将始终采用具有较高回报的策略。在不失一般性的情况下,在这项工作中将λ\lambdaλ设置为1。

结果如下:

5.3 双层结构仿真

这里,N1N_1N1​、N2N_2N2​分别表示两层网络的大小。第一个网络中的代理会随机链接到属于网络2的代理。

具体的连接可表示如下:

在每个时间步骤中,一层的智能体i都会面临两个策略选择:

  • 采用模仿概率为p([0,1])的另一层邻居策略。
  • 模仿了位于同一层代理的策略。

5.4 N1=N2N_1 = N_2N1​=N2​仿真结果

此时,即每层网络都有邻层相邻的节点。具体仿真结果为:

5.5 N1≠N2N_1 \neq N_2N1​​=N2​仿真结果


6 结论

具有阈值和惩罚成本的多人雪堆博弈有助于描述一些特殊的集体困境中的战略竞争。该模型的主要亮点是阈值,惩罚和利他惩罚,它们可以更恰当地描述一些集体困境。

适当的阈值可以增强合作者的主导地位。此外,加大对搭便车者的惩罚促进了合作,而增加了惩罚成本却阻碍了人们向合作状态的演变。

而且,我们将模型从单层复杂网络扩展到了双层。仿真结果表明,阈值的存在有利于单层无标度网络上合作者的维护。在双层方案中,通过更大的阈值来促进协作行为,并且两层之间的互连将增强网络互惠性。

论文精读——基于演化动力学的复杂网络中带阈值雪堆博弈模型研究相关推荐

  1. 【数学模型】基于matlab实现车载自组织网络中路边性能及防碰撞算法研究

    1 简介 随着智能交通系统的发展,车载自组网(VANET)已经成为该领域的热门网络通信技术.车载网络是一种透过随意网络提供车辆之间的通讯,即由无线通信与数据传递技术,串联交通工具以及路边交通设施,所形 ...

  2. 《中国人工智能学会通讯》——8.25 基于演化优化的生物网络配准

    8.25 基于演化优化的生物网络配准 生物网络配准是为了找到不同种群之间不同蛋白质网络的相似子图.生物网络配准可以帮助我们预测蛋白质功能.网络配准主要分为局部网络配准和全局网络配准两种.局部网络配准是 ...

  3. 论文精读——基于机器学习的越南生活固体废弃物预测

    论文精读--基于机器学习的越南生活固体废弃物预测 Abstract 1. Introduction(partly) 2. ML - based models and applications for ...

  4. 通信工程论文 通信网络中故障数据优化检测仿真研究

    通信网络中故障数据优化检测仿真研究 专业:通信工程 2022年5月 论文题目:通信网络中故障数据优化检测仿真研究 学科专业:通信工程 摘 要 在对通信网络之中的故障数据进行检测时,考虑到在通信网络之中 ...

  5. 小勇rust_基于领域和贝叶斯网络的P2P电子商务细粒度信任模型

    基于领域和贝叶斯网络的 P2P 电子商务细粒度信任模型 田俊峰 田 瑞 [摘 要] 摘 要 针对现有 P2P 电子商务模型信任粒度比较粗糙 , 不能很好体现节 点真实行为的问题 . 提出一种细粒度信任 ...

  6. 【论文翻译】从进化和异质网络中表征和预测社区成员

    从进化和异质网络中表征和预测社区成员 摘要 近年来,从web数据中挖掘不同类型的社区吸引了大量的研究工作.然而,现有的社区挖掘技术都没有考虑到web数据的动态性和异构性.在本文中,我们提出了从异构we ...

  7. Nat. Mach. Intell. | 基于深度强化学习寻找网络中的关键节点

    今天给大家介绍哈佛大学Yang-Yu Liu课题组和加利福尼亚大学洛杉矶分校Yizhou Sun课题组发表在nature machine intelligence上的一篇文章"Finding ...

  8. 【CV论文解读】AAAI2021 | 在图卷积网络中超越低频信息

    论文解读者:北邮 GAMMA Lab 博士生  薄德瑜 题目: 在图卷积网络中超越低频信息 会议: AAAI 2021 论文链接: https://arxiv.org/abs/2101.00797 图 ...

  9. 论文《基于区块链的物联网节点可信算与隐私保护方法研究》学习报告

    <基于区块链的物联网节点可信算与隐私保护方法研究> 相关技术介绍 1.区块链技术工作原理及流程 2.区块链验证方式与数据结构 3. 智能合约 创新点 创新点1:基于区块链的物联网节点可信计 ...

  10. 深度学习论文导航 | 06 SSP-Net:深度卷积网络中的空间金字塔池用于视觉识别

    前言:这是一篇比较老的文章了,是何恺明大神于2015年在IEEE上发表的,到目前为止被引用量已经达到2038.SPP-Net是一种可以不用考虑图像大小,输出固定长度的特征向量的网络结构,并且可以做到在 ...

最新文章

  1. nvidia旧版驱动_N卡用户注意:老版驱动存在5个高危漏洞,赶紧更新
  2. jinfo 的相关使用 || 两个经典的参数: -Xms -Xmx
  3. codeforces315Div1 B Symmetric and Transitive
  4. android 测试网,Android Monkey测试
  5. 计算机网络 鲁士文,《在职研究生计算机网络课程统考复习指南》鲁士文 编_孔网...
  6. QT+OpenCV综合示例:载入、读取图片
  7. 3行代码实现ftp 上传、下载、删除操作集合
  8. nofollow标签_SEO技术动态:谷歌升级Nofollow标签的作用
  9. (微信小程序)二 : 创建一个页面
  10. Unity Inspector 给组件自动关联引用
  11. 转帖节选:卓有成效的管理者(彼得.德鲁克)
  12. 【车道线检测与寻迹】2月24日 CVST工具箱模块仿真与图像处理(二)、基于Vision对象的边缘检测、余弦变换压缩,与峰值信噪比
  13. 使用计算机时鼠标和键盘各有什么优缺点,计算机键盘与鼠标的使用简介.ppt
  14. ps|grep命令详解
  15. 离线强化学习(Offline RL)系列3: (算法篇) TD3+BC 算法详解与实现(经验篇)
  16. 美通社企业新闻汇总 | 2019.1.23 | 上海迪士尼建疯狂动物城园区;戴森运营总部移至新加坡...
  17. PHP正则表达式修饰符
  18. Oracle问题:如何远程连接Oracle数据库
  19. 64位下php环境安装教程,PHP环境安装
  20. 消失的“金九银十” 互联网的下一个五年在哪里?

热门文章

  1. 为什么要分层?数据仓库分层架构深度讲解
  2. 解决win10系统安装ch341驱动程序显示“预安装成功”的一个方法
  3. 相机成像原理RAW,RGB,YUV
  4. 面试之MySQL调优问题
  5. 时间片轮转调度算法(Java)
  6. 样条曲线(spline)
  7. C语言面试常见问题总结
  8. 烽火吉比特HG261GU获取超级密码教程
  9. ArrayList错误:java.util.ConcurrentModificationException:null
  10. Aerial为苹果而生,一款炫酷的Mac屏幕保护程序