电动汽车(ev)已经成为一种很有前途的低碳交通目标。虽然有大量的公共充电站可用,但这些充电站的使用往往是不平衡的,给充电站运营商(CSOs)带来了许多问题。本文提出一种多智能体图卷积强化学习(MAGC)框架,通过为每个不断出现的收费请求提供动态定价,以优化多个长期商业目标,使公民社会组织能够更有效地利用这些站点。具体而言,首先将充电站基于用户需求的动态定价问题建模为一个混合竞争-合作的多智能体强化学习问题,每个充电站都是一个智能体;此外,通过将整个充电市场建模为一个动态异构图,设计了一个多视图异构图注意力网络,以融合智能体之间的多样化关系所诱导的复杂相互作用。然后,提出一个共享元生成器,基于提取的元特征为大规模且多样化的agent生成个性化定制的动态定价策略。最后,我们设计了一个对比异构图池化表示模块来学习一个浓缩而有效的状态动作表示,以促进大规模智能体的策略学习。在两个真实数据集上的大量实验证明了MAGC的有效性,并实证表明,如果充电市场中的所有充电站都采用我们的动态定价政策,充电站的整体使用可以得到改善。

图2显示了magc的框架概述。首先,将每个充电站视为一个agent,将CSRSDP建模为混合竞争-合作MARL任务;然后,采用一种具有分散执行与集中训练(DECT)架构的多智能体actor-critic方法,在大规模智能体上实现高效的分布式多智能体管理(dma)和有效的集中式多智能体策略学习(CMAPL)。具体而言,dma由一个多视图异构图注意力网络(MVHGAT)模块和一个共享元生成器模块组成,该模块对智能体之间的复杂相互作用进行建模,并根据提取的元特征为每个大规模智能体生成个性化定制的动态定价策略。在CMAPL中,设计了一个对比异构图池化表示(CHGPR)模块,用于从整个充电市场中学习智能体的精简而有效的状态动作表示。然后,critic利用该状态动作表示学习大规模智能体的协调策略。在CMAPL完成后,实际中只需要dma即可实现高效的充电站动态定价。

Multi-Agent Graph Convolutional Reinforcement Learning for Dynamic Electric Vehicle Charging Pricing相关推荐

  1. 强化学习(Reinforcement Learning)背景介绍

    强化学习前世今生 如今机器学习发展的如此迅猛,各类算法层出不群,特别是深度神经网络的发展,为非常经典的强化学习带来了新的思路,虽然强化学习一直在发展中,但在2013年这个关键点,DeepMind大神D ...

  2. 强化学习系列(1):强化学习(Reinforcement Learning)

    强化学习前世今生 也可以直接查看本博主强化学习专栏的简介: https://blog.csdn.net/gsww404/article/details/79763003 [直接点击查看完整版] 如今机 ...

  3. 2021 牛津大学:Recent Advances in Reinforcement Learning in Finance

    Recent Advances in Reinforcement Learning in Finance 1 本文概述 本文是牛津大学2021年对 深度强化学习在金融领域内各种决策的应用 的综述文章. ...

  4. 【论文阅读】2021年牛津大学的 Survey:Recent Advances in Reinforcement Learning in Finance

    1 本文概述 本文是牛津大学2021年对 深度强化学习在金融领域内各种决策的应用 的综述文章.文章分为四个部分,第一部分是整体介绍:第二部分详细介绍了强化学习的基础知识,包括马尔科夫决策过程的定义.基 ...

  5. 深度强化学习 Deep Reinforcement Learning 学习整理

    这学期的一门机器学习课程中突发奇想,既然卷积神经网络可以识别一副图片,解决分类问题,那如果用神经网络去控制'自动驾驶',在一个虚拟的环境中不停的给网络输入车周围环境的图片,让它去选择前后左右中的一个操 ...

  6. Reinforcement Learning Enhanced Heterogeneous Graph Neural Network阅读笔记

    强化学习增强异质图神经网络 代码源:https://github.com/zhiqiangzhongddu/RL-HGNN 摘要 异构信息网络(HINs)涉及多种节点类型和关系类型,在许多实际应用中非 ...

  7. [论文翻译]DeepPath: A Reinforcement Learning Method for Knowledge Graph Reasoning

    DeepPath: A Reinforcement Learning Method for Knowledge Graph Reasoning 0 总结 名称 项目 题目 DeepPath: A Re ...

  8. 【论文导读】- EvolveGCN: Evolving Graph Convolutional Networks for Dynamic Graphs(EvolveGCN:用于动态图的演化图卷积网络)

    文章目录 论文信息 摘要 evolving graph convolutional network 图卷积网络 (GCN) 权重更新 Evolving Graph Convolution Unit ( ...

  9. Dynamic Graph CNN for Learning on Point Clouds(DGCNN)论文阅读笔记——核心思想:EdgeConv细析

    DGCNN 前言与声明 因为关心的领域主要是配准,对于分类等网络的架构设计分析并没有侧重太多,主要侧重的是EdgeConv的思想. 文中图片全部来自于PointNet,PointNet++,DGCNN ...

最新文章

  1. R语言ggplot2可视化:可视化堆叠的直方图、添加每个分组的每个bin的计数标签、在堆叠直方图的bin中的每个分组部分添加数值标签
  2. 智能卡检测控制系统检测m1这么操作_土壤检测实验室仪器设备配置方案
  3. 2016/08/24 CppCon 2015 Bjarne Stroustrup “Writing Good C++14
  4. 让oracle做定时任务【转】
  5. Linux GDB调试
  6. 都说不要装箱,那装箱到底带来了什么开销?
  7. 华为云企业主机安全服务之“网页防篡改”:拒绝网页变脸,服务实时在线
  8. 【Kafka】kafka replication factor : 3 larger than avaiable brokers:2
  9. 使用docker下载并安装mongodb5.0.5
  10. 2021 年全国大学生数据统计与分析竞赛
  11. Python 爬虫案例
  12. LaTeX插入参考文献手把手教学 | BibTeX教程
  13. 利用中文维基百科训练词向量模型
  14. 多金的ToG项目总结——数字人民币
  15. less (三) 一个less 文件引用另一个less文件
  16. 山西票号的内部控制分析
  17. 佛祖,你为什么不帮我
  18. 测试服务器UDP/TCP丢包率
  19. 【工大SCIR笔记】多方对话研究简述
  20. 中衍期货开户|资深老师盘中交流

热门文章

  1. 路由器交换与配置综合实验(二)外网
  2. VisualStudio2012的序列号
  3. 我的Android进阶之旅------/storage/sdcard0, /sdcard, /mnt/sdcard ,/storage/emulated/legacy 的区别
  4. XSS漏洞利用——键盘记录
  5. 小白学习日记 eclipse的下马威
  6. 解决centos中vsftpd中文乱码
  7. 基恩士XG-XvisionEditor离线仿真
  8. 计算机考研考的是英语作文,2007年考研英语作文真题及范文
  9. 课程格子创始人李天放:在工具+社交中寻找机会
  10. 深圳高交会ZDNS发布域名服务安全威胁管控系统,为互联网入口保驾护航