【文献阅读01】Eco-Vehicular Edge Networks for Connected Transportation: A Distributed Multi-Agent Reinfor
Eco-Vehicular Edge Networks for Connected Transportation: A Distributed Multi-Agent Reinforcement Learning Approach(点击可见原文)
论文要解决的问题
用户中心式的虚拟小区 (VC, virtual cell) 中,考虑V2I通信,在保证可靠性、数据速率、用户公平性的前提下,通过资源分配最大化能效 (EE, energy-efficient) 。
使用分布式多主体强化学习加以解决。
通信场景
用U表示VU (vehicle user, 车辆用户) 的集合,用A表示AP的集合,用B表示边缘服务器的集合。边缘服务器与云端相连,其无线资源有限,用W_l Hz表示。在云端服务器可获得完整的CSI信息,其可以调度AP的波束赋形的权重。
为每个用户规划单独的VC提供服务,VU-AP的连接关系用下式表示
V2I通信模型
考虑多入单出的通信模型,车辆单天线,AP有个天线。
一个time slot内,信道服从 quasi-static flat fading 。
VU 和多个 AP 之间的信道表示为:
VU 和单个 AP (多天线) 的信道响应:
大尺度衰落、log-Normal 阴影衰落、快衰落:
AP 到 VU 的波束赋形权重:
AP a_j传输的信号:,x为单位能量信号。
下行接收信号:
用户中心式小区构成
VU的可达速率:
其中为SINR。
到VU 的下行链路损耗:
EE计算:
构建联合优化问题:
寻找VU-AP连接关系、波束赋形权重
约束于:7b:确保每个VC内的AP数大于一; 7c:确保SINR大于阈值;7d:总功率有限; 7e:用户连接是bool量。
为便于求解,将AP的传输功率分成 K 个离散数值。
波束赋形向量表示为:
动作空间大小为:
我们使用QL来解决上述优化问题。
解法:强化学习
状态空间为,分别表示VU的位置,AP的位置,链路的CSI。
动作空间:VU-AP链接,波束赋形向量。
奖励函数:
为确保公平性,设置如下限制,由此可保证agent不会选择使任何用户的SINR小于SINR阈值的动作:
SARL(Single Agent Reinforcement Learning)
QL公式如下所示:
在状态和动作空间过大时,SARL很难处理。此外,当环境的状态有限时,通常用某种方法进行近似,但对于每个近似状态,agent仍需要从动作空间中选取合适的动作。为此,使用D-MARL算法改进
Distributed Multi-Agent RL (D-MARL)
通常来讲,MARL通过控制每个agent对于各自的状态选择动作,进而缩小每个agent的动作空间。
对于场景中的N个agent,Q-table的维度变为,动作空间大小变为
此外,使用集中式向量Q存储每个状态的宏观最佳动作:
总体算法如下:
实验设计
如下所示:
文献[14]:“3rd Generation Partnership Project; Technical Specification Group Radio Access Network; Study on LTE-based V2X Services,” 3GPP TR 36.885 V14.0.0, Release 14, Jun. 2016.
场景如下,设置VU并排行驶
对照组设置为:1.遍历所有可能的动作以获取最大reward;2.SARL;3.MARL(作为state of art);4.功率平均分配;5.随机功率分配。
性能表现如下:
结论:
- 与两种目前较先进的MARL算法相比,本算法只需要1/4的episode即可达到相似性能
- SINR阈值的影响:增大SINR阈值意味着对于agent的要求变大,随着SINR阈值增大,因此各方案的传输成功率均减小,但D-MARL和MARL的差距更加明显,在此实验中4 5方案效果格外差。
- 覆盖范围的影响:随着小区半径增加,AP可服务更多VU,这将增加单个小区内的用户速率和;此外,用户和AP距离增加说明AP需要发送更大功率以到达边缘的VU,这强迫agent找到最佳功率分配。因此小区范围增加时,D-MARL对应的EE更佳(但没有SARL好)
- 用户公平性的影响:公平是指AP对于所有用户发以相同的速率发送数据。我们用 ( 9 ) 式表示对于公平性考虑。笨方法的公平性为0。99915,遍历法、SARL、MARL分别为0.99915, 0.99915,0.99899。
【文献阅读01】Eco-Vehicular Edge Networks for Connected Transportation: A Distributed Multi-Agent Reinfor相关推荐
- 【文献阅读10】Scale-Aware Trident Networks for Object Detection-用于目标检测的尺度感知三叉戟网络
[文献阅读10]Scale-Aware Trident Networks for Object Detection-用于目标检测的尺度感知三叉戟网络 Abstract 1. Introduction ...
- 文献阅读 - 01 Zotero基础(陆续更新)
Zotero文献管理 1 准备工作 1.1 安装Zotero 1.2 注册Zotero账号 2 使用云端储存附件 2.1 Onedrive教育 2.2 Zotero+Onedrive设置 3 Zote ...
- 【文献阅读】Augmenting Supervised Neural Networks with Unsupervised Objectives-ICML-2016
一.Abstract 从近期对unsupervised learning 的研究得到启发,在large-scale setting 上,本文把unsupervised learning 与superv ...
- 【文献阅读】Perceptual Generative Adversarial Networks for Small Object Detection –CVPR-2017
Perceptual Generative Adversarial Networks for Small Object Detection 2017CVPR 新鲜出炉的paper,这是针对small ...
- 【文献阅读01】动态可重配置数据流的 74TMACS/W CMOS-RRAM 神经突触核以及概率图模型的在线转置权重
标题:A 74 TMACS/W CMOS-RRAM Neurosynaptic Core with Dynamically Reconfigurable Dataflow and In-situ Tr ...
- 【文献阅读】A2-Nets: Double Attention Networks
原文链接:https://arxiv.org/abs/1810.11579 学习捕获长距离关系是图像/视频识别的基础.现有的CNN模型一般依赖于增加深度来对这种关系进行建模,效率非常低.作者提出了&q ...
- 高光谱图像分类:文献阅读
文献阅读<Multiscale Densely-Connected Fusion Networks for Hyperspectral Images Classification> 目录 ...
- 谣言检测文献阅读二—Earlier detection of rumors in online social networks using certainty‑factor‑based convolu
系列文章目录 谣言检测文献阅读一-A Review on Rumour Prediction and Veracity Assessment in Online Social Network 谣言检测 ...
- 文献阅读:Improving neural networks by preventing co-adaptation of feature detectors
文献阅读:Improving neural networks by preventing co-adaptation of feature detectors ----通过防止特征检测器的共适应以改进 ...
- POI推荐文献阅读笔记3:Predicting Human Mobility via Graph Convolutional Dual-attentive Networks
POI推荐文献阅读笔记3: Predicting Human Mobility via Graph Convolutional Dual-attentive Networks 1.摘要 2.贡献 3. ...
最新文章
- 三星a5009Android6.0,三星A5009原版系统刷机包_三星A5009最新升级包线刷包和root
- debian+pxe+preseed.cfg 安装配置
- Windows - CMD窗口UTF8编码乱码问题的解决!
- python之路_Python之路
- 飞鸽传书mayfish 数据入库验证
- 2018-CBAM论文讲解
- Spark算子:RDD行动Action操作(2)–take、top、takeOrdered
- 【声源定位】基于matlab阵列流形矩阵信号显示【含Matlab源码 549期】
- 事记:关于远控软件导致win10屏幕亮度无法调节的解决方案
- win7更新_今天,Win7正式终止更新,扫雷成为历史
- 一个朋友写的诗词收藏
- 什么是常量,常量的类型有哪些?
- Vulhub-DC-8靶场实战攻略
- util是utiliy的缩写,意为多用途的,工具性质的包
- Mac上最强大的截图软件-xnip
- 人撒娇地撒基督教扫ID祭扫我京东is啊单间
- 【总结】解决MAPPO(Multi-Agent PPO)问题技巧
- echarts 折线图,无数据时不显示灰色线条
- 自定义滚动条样式 -webkit-scrollbar
- 元数据与数据治理实战|Hadoop发展历程(1)
热门文章
- 摆脱“咖喱味”,让Win11的右键菜单回归经典
- win7 任务栏图标计算机,电脑系统win7怎么修改任务栏的图标
- 关于人事档案都看看 给你们敲响警钟(
- Mysql 基准测试
- 5G网络优化工程师是做什么的?4大工作职责!
- 新猿木子李:0基础学python培训教程 Python操作Excel之读取数据
- java计算机毕业设计bs架构实习管理系统MyBatis+系统+LW文档+源码+调试部署
- ~艾比郎~学Python之Python基础
- luci html 页面,luci界面修改
- 用计算机计算1357城八十九十,1357单元.doc