摘要

【目的】在车载网络边缘计算中,合理地分配频谱资源对改善车辆通讯质量具有重要意义。频谱资源稀缺是影响车辆通讯质量的重要原因之一,车辆的高移动性以及在基站处准确收集信道状态信息的困难给频谱资源分配带来了挑战性。【方法】针对以上问题,优化目标设定为车对车(Vehicle-to-Vehicle, V2V)链路传输速率和车对基础设施(Vehicle-to-Infrastructure, V2I)容量大小,提出一种基于近端策略优化(Proximal Policy Optimization, PPO)强化学习算法的多智能体频谱资源动态分配方案。【结果】面对多个V2V链路共享V2I链路所占用的频谱资源从而缓解频谱稀缺问题。这一问题被进一步制定为马尔可夫决策过程(Markov Decision Process, MDP),并对状态、动作和奖励进行了设计,以优化频谱分配策略。【结论】仿真结果表明,在信道传输速率和车辆信息传递成功率方面,所提出的基于PPO算法的优化方案与基线算法相比具有更优的效果。

关键词: 车载网络边缘计算; 频谱分配; 马尔可夫决策过程; 近端策略优化

引言

近年来,

基于近端策略优化算法的车载边缘计算网络频谱资源分配相关推荐

  1. 强化学习经典算法笔记(十二):近端策略优化算法(PPO)实现,基于A2C(下)

    强化学习经典算法笔记(十二):近端策略优化算法(PPO)实现,基于A2C 本篇实现一个基于A2C框架的PPO算法,应用于连续动作空间任务. import torch import torch.nn a ...

  2. 基于近端策略优化的阻变存储硬件加速器自动量化

    摘 要 卷积神经网络在诸多领域已经取得超出人类的成绩.但是,随着模型存储开销和计算复杂性的不断增加,限制处理单元和内存单元之间数据交换的"内存墙"问题阻碍了其在诸如边缘计算和物联网 ...

  3. 近端策略优化算法(PPO)

    策略梯度算法(PG) 策略梯度迭代,通过计算策略梯度的估计,并利用随机梯度上升算法进行迭代.其常用的梯度估计形式为: E^t[∇θlogπθ(at∣st)A^t]\hat{\mathbb{E}}_t[ ...

  4. PPO近端策略优化算法概述

    Policy Gradient算法存在两个问题,一是蒙特卡罗只能回合更新,二是on-policy采集的数据只能使用一次. 对于第一个更新慢的问题,改用时序差分方法,引入critic网络估计V值,就能实 ...

  5. 【MATLAB教程案例15】基于WOA鲸鱼优化算法的函数极值计算matlab仿真及其他应用

    FPGA教程目录 MATLAB教程目录MATLAB教程目录MATLAB教程目录 ------------------------------------------------------------ ...

  6. 【MATLAB教程案例16】基于GWO灰狼优化算法的函数极值计算matlab仿真及其他应用

    FPGA教程目录 MATLAB教程目录 目录 1.软件版本 2.GWO灰狼优化算法的理论知识 2.1包围 2.2追捕 2.3攻击

  7. 【MATLAB教程案例12】基于GA遗传优化算法的函数极值计算matlab仿真及其他应用

    FPGA教程目录 MATLAB教程目录 -------------------------------------------------------------------------------- ...

  8. 【MATLAB教程案例13】基于SA模拟退火优化算法的函数极值计算matlab仿真及其他应用

    FPGA教程目录 MATLAB教程目录 -------------------------------------------------------------------------------- ...

  9. 强化学习笔记:PPO 【近端策略优化(Proximal Policy Optimization)】

    1 前言 我们回顾一下policy network: 强化学习笔记:Policy-based Approach_UQI-LIUWJ的博客-CSDN博客 它先去跟环境互动,搜集很多的 路径τ.根据它搜集 ...

最新文章

  1. 【 MATLAB 】常用的离散时间序列的 Matlab 产生
  2. [BZOJ2456/ZOJ2132]mode/The Most Frequent Number
  3. 【工作笔记】没有界面程序调用ActiveX控件
  4. linux C/C++开发环境搭建指南
  5. Linux下通过命令设置系统时间
  6. Ubuntu 创建快捷方式的方法
  7. 去中心化NFT交易生态系统Mochi.Market将在DAO Pad进行SHO
  8. 【Python数据分析】数据挖掘建模——分类与预测——回归分析
  9. 创业公司如何做到零成本实现用户快速增长
  10. 3.写一个简单的弹出菜单
  11. 《剑指offer》66道算法题合集(java实现)
  12. 使计算机拒绝远程桌面服务,拒绝通过远程桌面服务登录
  13. 《汉魏风云》2、孙吴兵法第一传人——辛苦的天才曹操
  14. 数仓 - 生命周期、用户价值、忠诚度、活跃度计算
  15. 使用navicat进行mysql数据库拷贝
  16. 01、java02-运算符 流程控制 方法
  17. 分类常用的神经网络模型,典型神经网络模型包括
  18. python回调廖雪蜂_廖雪峰Python总结4
  19. Exchange邮件归档解决方案
  20. 【2.0版】监测数据处理系统-自动导出监测日报表、周报表及月报表(基坑监测、地铁监测)V2.0

热门文章

  1. Unity将世界坐标转为UI坐标
  2. 在Ubuntu16.04系统上更新FireFox浏览器(即火狐浏览器)到最新版本
  3. 一万五千字讲清Java当中Collection下的接口
  4. word插入图表目录的时候同时插入了原图的解决办法
  5. 2021江苏大学生编程大赛I题(省赛试水)
  6. 浅谈NLM非局部均值滤波
  7. DOS子程序汇编样例及详解
  8. 三个步骤教你如何通过天猫精灵控制智汀,实现不同生态设备相互联动
  9. pythonsqlite操作_在Python中操作SQLite3
  10. OpenSCAP安装与使用