**基于深度强化学习的全覆盖路径规划飞行器**
论文题目《UAV Coverage Path Planning under Varying Power Constraints using Deep Reinforcement Learning》
论文主要内容:1.利用DDQN做路径规划
2.利用卷积神经网络处理全局地图
3.考虑能量约束,任意位置起降
摄像头给出当前的覆盖率视图,GPS给出无人机的位置
覆盖问题利用三通道的二维网格图分析,设置三个主要区域:起降区,禁飞区,目标区;一个网格区域可以同时被设置为这三个区域中的一个或者多个,但是不能同时事起降区和禁飞区。
飞行器位置使用独热码表示,它可以与三通道地图和覆盖网格以五通道输入网络的卷积层来编码。
实验
每次训练循环都有能量预算,每一个动作进行时,飞行器在当前位置无论是接受还是不接受都消耗一个单位的能量预算。
飞行器的初始位置由一个固定地图,零初始化的覆盖网格和位置组成
飞行器的摄像头可视范围设定为摄像头正下方3*3的网格区域,每一步动作后,地图都会标记覆盖网格中的可视范围
利用三个不同的地图进行训练,评估覆盖率和训练次数
蓝色为起降区,黄色时初始位置,白色时终止位置,绿色时目标区,红色是禁飞区,黑色表示未覆盖
论文没有源码
**基于深度强化学习的全覆盖路径规划飞行器**相关推荐
- 论文研读——基于深度强化学习的自动驾驶汽车运动规划研究综述
论文研读--Survey of Deep Reinforcement Learning for Motion Planning of Autonomous V ehicles 此篇文章为论文的学习笔记 ...
- 第七章 人工智能,7.1 基于深度强化学习与自适应在线学习的搜索和推荐算法研究(作者:灵培、霹雳、哲予)...
7.1 基于深度强化学习与自适应在线学习的搜索和推荐算法研究 1. 搜索算法研究与实践 1.1 背景 淘宝的搜索引擎涉及对上亿商品的毫秒级处理响应,而淘宝的用户不仅数量巨大,其行为特点以及对商品的偏好 ...
- 谣言止于智者:基于深度强化学习的谣言早期检测模型
「论文访谈间」是由 PaperWeekly 和中国中文信息学会社会媒体处理专委会(SMP)联合发起的论文报道栏目,旨在让国内优质论文得到更多关注和认可. 谣言一般是指未经核实的陈述或说明,它往往与某一 ...
- 通过图注意力神经网络进行多智能体游戏抽象_[读论文] AttnPath: 将图注意力机制融入基于深度强化学习的知识图谱推理中...
论文原文:Incorporating Graph Attention Mechanism into Knowledge Graph Reasoning Based on Deep Reinforcem ...
- 基于深度强化学习的区域化视觉导航方法
基于深度强化学习的区域化视觉导航方法 人工智能技术与咨询 本文来自<上海交通大学学报>,作者李鹏等 在环境中高效导航是智能行为的基础,也是机器人控制领域研究的热点之一.实现自主导航 ...
- 基于深度强化学习的机器人运动控制研究进展 | 无模型强化学习 | 元学习
1.基于深度强化学习的机器人运动控制研究进展 1.1 深度强化学习 1.1.1 强化学习简介: 强化学习(Reinforcement Learning, RL)利用试错机制与环境进行交互,旨在通过最大 ...
- 基于深度强化学习的车道线检测和定位(Deep reinforcement learning based lane detection and localization) 论文解读+代码复现
之前读过这篇论文,导师说要复现,这里记录一下.废话不多说,再重读一下论文. 注:非一字一句翻译.个人理解,一定偏颇. 基于深度强化学习的车道检测和定位 官方源码下载:https://github.co ...
- 【ML4CO论文精读】基于深度强化学习的组合优化问题研究进展(李凯文, 2020)
基于深度强化学习的组合优化研究进展 本人研究方向(博士期间):多目标组合优化与决策研究--致力于多约束多目标多任务组合优化算法和多目标决策系统的研究与开发,以及多目标优化技术在一些工程实践中的应用. ...
- 基于深度强化学习的区域化视觉导航方法
基于深度强化学习的区域化视觉导航方法 人工智能技术与咨询 本文来自<上海交通大学学报>,作者李鹏等 关注微信公众号:人工智能技术与咨询.了解更多咨询! 在环境中高效导航是智能行为的基础,也 ...
最新文章
- 2引擎帮助文档_【虚幻4】初学者系列教程-《基础入门》#2-学习虚幻4的15个途径...
- 一个简单的反向连接服务程序
- POJ2823 Sliding Window【单调队列】【线段树】【ST表】
- c语言程序后退_c语言中向后退一格是啥符号?
- 2016和2017的区别就是昨晚和今早
- xmemcached spring 配置文件
- Easyspy网络检测系统
- native react 常用指令_React Native 常用的 15 个库
- (转)CKEditor和CKFinder在ASP.NET中的应用
- power bi 背景图_Power BI桌面脉冲图
- 互联网公司的规律.txt
- Nicescroll用法
- c语言设计数字增量pi控制器,PI控制器的工作原理是什么?
- /etc/shadow可以破解吗?
- python ttf font weight_使用FontCreator将ttf字体制作多字重字体并打包为Magisk字体模块...
- 国内公有云大厂核心技术解剖
- 关闭和重启脚本合二为一orderlist.sh
- Dungeon Master题解bfs
- 中年妇女,偶很想念你
- 如何关上计算机设备锁,微信如何设置应用锁?微信怎么开启设备锁?