均值场博弈_平均场博弈论(Mean-field Games)简介
平均场博弈论(Mean-Field Games)研究的是大量对象之间的博弈,探索在一个竞争的环境中,对象如何选择最优的决策。例如股市里大量根据其他用户行为交易股票的股民,海里游动的鱼群,在世界杯现场看足球赛的观众等。目前,平均场博弈论在经济、金融、机器学习等方面都有应用。那什么是平均场呢?平均场的博弈是指在博弈的场景中,某个对象进行决策所依赖的信息来自于场景中所有对象的决策的概率分布,而不是对其他对象的决策进行单个考虑。例如,去市场买菜,我们可以去了解其他所有买菜和卖菜人的买卖行为来做自己买菜的决定,这样是非常麻烦和不方便的。在平均场博弈论中,我们只需要根据菜的市场价来决定自己是否买菜,而这个市场价已经反映了市场中买卖的所有参与者对菜的买卖决策,所以菜的市场价可以看做是一种平均场,反映了市场中其他参与对象决策的概率分布。因此,根据市场价来决策简化了我们做决定的时间和难度。
1.
个对象的博弈
平均场博弈论是对
个对象在
趋向于无穷大的时候的博弈情况的近似。因此,我们首先看看
个对象的博弈。假设现在环境中有
个对象。为了简化模型,我们假设对象之间是不可区分的,例如我们可以想象成有
只蚂蚁,或者
均值场博弈_平均场博弈论(Mean-field Games)简介相关推荐
- 均值场博弈_平均场博弈论数值算法之系数法
在上一篇文章< 的Hamilton-Jaboci等式与关于 的Fokker-Plank等式耦合在了一起.在这篇文章中,我们介绍一个求解非局部耦合一阶平均场博弈论的数值算法.文章内容来自Levon ...
- python 职场需求_职场必备:如何用Python提升未来竞争力?
今年很多人在问一个问题:到底什么才是抗风险能力? 稳定的工作?存款?理财? 有人预测:"到2030年,今天一半的工作岗位都将消失." 关于哪些工作最先消失,李开复提出过" ...
- lgg7深度详细参数_深度学习平均场理论第七讲:Batch Normalization会导致梯度爆炸?...
前言 Batch Normalization (BN)对于深度学习而言是一项非常重要的技术.尽管BN在网络训练的过程中表现力非常强大,但是大家始终没有一个很好的理论上的清晰理解.今天我们就试图解读这篇 ...
- 平均场理论(Mean-field theory)
文章目录 1. 起源 2. 有效性 3. 形式方法(Hamiltonian) 4. 应用 4.1 伊辛模型 4.1.1 形式推导 4.1.2 非相互作用自旋近似 4.2 应用于其他系统 4.3 推广到 ...
- 机器学习之变分推断(三)基于平均场假设变分推断与广义EM
机器学习笔记之变分推断--基于平均场假设变分推断与广义EM 引言 回顾:基于平均场假设的变分推断 深入认识平均场假设 经典变分推断与广义EM 引言 上一节介绍了基于平均场假设 的变分推断推导过程.本节 ...
- 机器学习笔记之玻尔兹曼机(三)梯度求解(基于平均场理论的变分推断)
机器学习笔记之玻尔兹曼机--基于平均场推断梯度求解 引言 回顾:玻尔兹曼机模型参数梯度求解困难与MCMC方法的处理方式 变分推断方法处理玻尔兹曼机对数似然梯度 引言 上一节介绍了使用马尔可夫链蒙特卡洛 ...
- 统计力学练习: Ising模型的平均场解以及严格求解
即使从经典模型来看,每个格点有自旋向上,自旋向下两种去值.假设对于N个格点,总的状态数就是2^N次方. 根据统计力学,我们需要对所有的状态进行求和. 因此一般来说,即使是最简单的模型,想要求出严格解未 ...
- 机器学习笔记之玻尔兹曼机(三)基于平均场理论变分推断的梯度求解(续)
机器学习笔记之玻尔兹曼机--基于平均场推断梯度求解[续] 引言 Λ 3 \Lambda_3 Λ3梯度求解 求解最优参数 ϕ ^ j \hat {\phi}_j ϕ^j 引言 基于玻尔兹曼机(三) ...
- python新旧特性过渡_转场(transition)(新)
马上注册,结交更多好友,享用更多功能,让你轻松玩转社区. 您需要 登录 才可以下载或查看,没有帐号?立即注册 x 转场(transition)(翻译:被诅咒的章鱼) 在Ren'Py中,转场(trans ...
最新文章
- Nginx、LVS及HAProxy负载均衡软件的优缺点详解
- troubleshoot之:使用JFR解决内存泄露
- C和指针之字符串memcpy、memmove、memset使用总结
- ivar layout 相关知识点
- (11)FPGA面试题同步复位与异步复位
- android中的资源文件
- linux下看io等待时间,Linux下用iostat探测IO使用情况
- BIND9源码分析之 多个view的情况下如何做dynamic update
- RAC连接时的2种方式Connect Time Failver和taf
- php 依赖注入 数据库切换_通俗易懂理解PHP依赖注入容器
- 音视频开发之旅(41)-天空盒
- 业内最小体积SOP8封装,带UART输出,高精度免校准计量芯片HLW8110
- 2022-5-6作业
- Android编译gradle提示A problem occurred evaluating project ':example'.
- 后台打log(便于查看问题和调试)方法
- html5手机网站需要加的那些meta标签,手机网站自适应
- LocalDate、LocalDateTime计算时间差
- 【转载】自然界通用的“质子缓存”模型
- arduino(2):使用ESP8266,接入超声波传感器。
- (转)大型网站的负载均衡器、db proxy和db