纳什均衡与帕累托最优
1. 囚徒困境(非零和博弈)
考虑一个囚徒困境的例子,来解释非零和博弈下出现的稳态:
纳什均衡:是指一种状态,这种状态是多个参与者在特定策略组下实现的稳定状态,此状态特点是:在该策略组下,任何人单独改变自己的策略都不会让自己变得更好,此时的策略被称为占优策略;囚徒困境中,无论对方选择什么,个人都选择背叛,这就是占优策略
帕累托最优:也是指一种状态,这种是多个参与者在特定分配方案下实现的稳定状态,此状态特点是:在该分配方案下,任何人无法通过损害别人的利益来提高自己的利益,也就是自己利益的提高必然会带来其他人的损失;囚徒困境中,当两人都选择沉默时,总体的获刑年限只有2年,此时达到了帕累托最优状态,没有其他的方案能够在不损失别人利益下来提高自己的利益
纳什均衡与帕累托最优: 纳什均衡一般出现在非合作博弈中,出发角度一般站在个体,强调的是个体足够理性,无论对方做什么动作,个体的策略都是Best-Response;而当我们谈到帕累托最优时,我们一般说分配方案,这是因为我们是站在整体角度来考虑问题的,像上帝一样分配个体资源从而达到整体最优化,是我们想要的是静态最优解;因为视角不同,帕累托最优和纳什均衡通常是矛盾的,但帕累托最优的整体利益一般要大于纳什均衡的整体利益
帕累托是最终的整体最优解吗? 不是,因为帕累托改进有一个条件:不损害别人的利益;有这样一个经典例子:一个百万富翁和一个快要饿死的乞丐,只要百万富翁拿出一点点钱就能挽救乞丐的性命,但这样做并不是帕累托改进,因为它损害了百万富翁的利益,虽然从整体上来说,花掉一点点钱来拯救一条性命可以让整体利益最大化,但这并不是帕累托最优,而是经典的功利主义,即通过资源的腾挪来实现整体最大化,而不再考虑个体的得失
2.下棋游戏(零和博弈):
囚徒困境是非零和博弈,而下棋是典型的零和博弈,这种博弈一定是非合作博弈,即一方的赢必然意味着另外一方的输,双方得失相加等于0,因此双方不存在合作和双赢的可能
纳什均衡:与非零和博弈下的纳什均衡一致
帕累托最优:在零和博弈下,任何初始的分配方案/策略组,都是帕累托最优,因为任何己方的改善必然会给对方带来损失,因此现在的状态就是最优的
纳什均衡与帕累托最优相关推荐
- 纳什均衡和帕累托最优
在研究非合作博弈中,最为常用的一个评价指标为纳什均衡(Nash equilibrium).通过纳什均衡可以较好的反应出参与博弈的各个个体的决策和博弈结果.根据纳什均衡的定义可知,采用可以满足纳什均衡的 ...
- 帕累托最优(Pareto Optimality)和纳什均衡(Nash Equilibrium)之间的关系
先说两个基本概念.概念的定义在wiki上都能找到,我在这里会再穿插一些关于概念的点评. 概念 帕累托最优,是对资源配置的一种评价.若某资源配置下,存在一种调整可以使得所有人的境况都不变差的前提下,有至 ...
- “囚徒困境”与帕累托最优理论以及基于OpenAI的辅助--测试(3)
"囚徒困境"与帕累托最优理论 1. "囚徒困境"的定义与理论起源 1.1 基本定义和起源 1.2 重复多次的"囚徒困境" 2. " ...
- 讲讲什么是帕累托最优
总第209篇/张俊红 今天这篇来给大家讲讲什么是帕累托最优,帕累托最优(Pareto Optimality),也称为帕累托效率(Pareto efficiency),是资源分配中的一个概念,最优表示资 ...
- 多目标优化之帕累托最优
帕累托最优 维基百科:帕累托最优是指资源分配的一种理想状态.给定固有的一群人和可分配的资源,如果从一种分配状态到另一种状态的变化中,在没有使任何人境况变坏的前提下,使得至少一个人变得更好,这就是帕累托 ...
- 使用帕累托最优选择解释涌现现象
在涌现现象中,许多简单的元素之间的相互作用和协调会导致一些新的.不可预测的现象或特性的出现.这些现象或特性可能涉及多个目标,例如学习速度.准确性.鲁棒性等等.在这种情况下,我们可以使用帕累托最优选择来 ...
- 帕累托改进和帕累托最优、卡尔多-希克斯改进
根据目标个数,分为单目标规划,以及多目标规划.多目标的规划是去找折中的解集合,既pareto最优解集合.对优化目标超过3个以上的,称之为超多目标优化问题. 帕累托改进描述的就是在没有人变得不好的前提下 ...
- 质量小议24 -- 帕累托最优
资源分配的一种理想状态 一种分配状态到另一种状态的变化中,任何人境况没有变坏,其中至少一人境况变的更好 充分利用有限的人力.物力.财力, 优化资源配置 以最小的成本创造最大的效率和效益 "无 ...
- 分布式能源接入分析matlab 通过分布式能源的选址定容确定得到帕累托最优解集
分布式能源接入分析matlab 通过分布式能源的选址定容确定得到帕累托最优解集,然后选择最优值进行分析,模型为双层模型,程序采用改进粒子群算法 _:89180639056410504快乐程序人
最新文章
- 【编程题目】输入一颗二元树,从上往下按层打印树的每个结点,同一层中按照从左往右的顺序打印...
- UA MATH571B 试验设计III 单因素试验设计1
- 51 NOD 1049 最大子段和 动态规划 模板 板子 DP
- Java 抽象类、接口
- 初学UML,画了几个UML图
- antd权限管理_推荐6款超好看实用的管理后台模版
- C语言学习笔记---字符读取函数scanf()、gets()、fgets()
- 很多绿化软件运行都会提示缺少msvcp71.dll、msvcr100.dll、msvcr71.dll等msvc**.dll文件错误解决方法
- vue element table 相关页面跳转实例代码
- c++ 写x64汇编 5参数_第9篇-C/C++ x86_64的函数栈
- mybatisplus 增删改查(普通)
- 消息驱动式微服务:Spring Cloud Stream RabbitMQ
- NOIP2013普及组 车站分级
- 你见过花140年拼出来的现存“古代最高积木”吗?
- Perfetto for linux-使用 Perfetto 分析调度问题
- JavaScript获取时间戳的坑
- 为什么在游戏开发中我不喜欢用MVC系列模式了
- 我们是如何测试360手机浏览器的 –360手机浏览器测试范围概述
- 计算机软件故障的排除方法,Windows 7系统常见小故障以及排除方法
- android 应用标识,App应用唯一标示码