最新最全论文合集——多智能体强化学习合作和竞争
AMiner平台(https://www.aminer.cn)由清华大学计算机系研发,拥有我国完全自主知识产权。平台包含了超过2.3亿学术论文/专利和1.36亿学者的科技图谱,提供学者评价、专家发现、智能指派、学术地图等科技情报专业化服务。系统2006年上线,吸引了全球220个国家/地区1000多万独立IP访问,数据下载量230万次,年度访问量超过1100万,成为学术搜索和社会网络挖掘研究的重要数据和实验平台。
必读论文:https://www.aminer.cn/topic
论文集地址:https://www.aminer.cn/topic/60a5cd7092c7f9be21f6da7d
近年来,随着强化学习在多个应用领域取得了令人瞩目的成果,并且考虑到在现实场景中通常会同时存在多个决策个体(智能体),部分研究者逐渐将眼光从单智能体领域延伸到多智能体,即多智能体强化学习(multi-agent reinforcement learning)。当同时存在多个智能体与环境交互时,整个系统就变成一个多智能体系统。每个智能体仍然是遵循着强化学习的目标,也就是是最大化能够获得的累积回报,而此时环境全局状态的改变就和所有智能体的联合动作相关了。因此在智能体策略学习的过程中,需要考虑联合动作的影响。本论文集包含多智能体强化学习合作和竞争论文。
该论文集共收录12篇论文,引用最多的论文为Multi-Agent Actor-Critic for Mixed Cooperative-Competitive Environments,引用数为1151。
下论文,到AMiner:https://www.aminer.cn
#AMiner# #论文#
最新最全论文合集——多智能体强化学习合作和竞争相关推荐
- 最新最全论文合集——法律智能
AMiner平台(https://www.aminer.cn)由清华大学计算机系研发,拥有我国完全自主知识产权.平台包含了超过2.3亿学术论文/专利和1.36亿学者的科技图谱,提供学者评价.专家发现. ...
- 最新最全论文合集——纵向联邦学习
AMiner平台(https://www.aminer.cn)由清华大学计算机系研发,拥有我国完全自主知识产权.平台包含了超过2.3亿学术论文/专利和1.36亿学者的科技图谱,提供学者评价.专家发现. ...
- 最新最全论文合集——多模态情感分析
AMiner平台(https://www.aminer.cn)由清华大学计算机系研发,拥有我国完全自主知识产权.平台包含了超过2.3亿学术论文/专利和1.36亿学者的科技图谱,提供学者评价.专家发现. ...
- 最新最全论文合集——SODA 历年最佳论文汇总
AMiner平台(https://www.aminer.cn)由清华大学计算机系研发,拥有我国完全自主知识产权.平台包含了超过2.3亿学术论文/专利和1.36亿学者的科技图谱,提供学者评价.专家发现. ...
- 最新最全论文合集——丘成桐数学科学中心
AMiner平台(https://www.aminer.cn)由清华大学计算机系研发,拥有我国完全自主知识产权.平台包含了超过2.3亿学术论文/专利和1.36亿学者的科技图谱,提供学者评价.专家发现. ...
- 最新最全论文合集——基于机器学习/深度学习的情绪识别
AMiner平台(https://www.aminer.cn)由清华大学计算机系研发,拥有我国完全自主知识产权.平台包含了超过2.3亿学术论文/专利和1.36亿学者的科技图谱,提供学者评价.专家发现. ...
- 最新最全论文合集——FOCS 历年最佳论文汇总
AMiner平台(https://www.aminer.cn)由清华大学计算机系研发,拥有我国完全自主知识产权.平台包含了超过2.3亿学术论文/专利和1.36亿学者的科技图谱,提供学者评价.专家发现. ...
- 最新最全论文合集——ICDE 历年最佳论文汇总
AMiner平台(https://www.aminer.cn)由清华大学计算机系研发,拥有我国完全自主知识产权.平台包含了超过2.3亿学术论文/专利和1.36亿学者的科技图谱,提供学者评价.专家发现. ...
- 最新最全论文合集——ISCA 历年最佳论文汇总
AMiner平台(https://www.aminer.cn)由清华大学计算机系研发,拥有我国完全自主知识产权.平台包含了超过2.3亿学术论文/专利和1.36亿学者的科技图谱,提供学者评价.专家发现. ...
最新文章
- 消息幂等(去重)通用解决方案
- ashx页面中context.Session[xxx]获取不到值的解决办法
- 五、MDT 2013 Update 1批量部署-WINDOWS 7样本机镜像部署
- 用Python Pandas处理亿级数据
- php如何编造简历,在简历里编造内容需要注意哪些问题?
- Java项目课程01:课程概述
- 用html编写勾股定理,一种勾股定理演示器的制作方法
- Oracle管理监控之sql developer配置与简单使用
- 自适应鲁棒控制(ARC)实例推导(手写超详细)
- Java获取一个月每周星期一至星期日的日期
- 无光照渲染shader-二次元
- FastDFS合并存储策略
- 如何选择分析场景?2种指标梳理方式
- 【项目管理】如何制定进度计划?
- 情人节简单浪漫烟花html的代码
- 支持两个USB Type-C接口都能投屏的便携显示器方案
- 2014年华为南研所校园招聘---机试+面试
- QQ浏览器怎么同步通讯录?QQ浏览器同步通讯录的方法
- 传统行业程序员的深度焦虑?——快来互联网行业吧!
- import java.awt.*这句话是什么含义