人群环境中基于深度强化学习的移动机器人避障算法
摘要: 为了控制移动机器人在人群密集的复杂环境中高效友好地完成避障任务,本文提出了一种人群环境中基于深度强化学习的移动机器人避障算法。首先,针对深度强化学习算法中值函数网络学习能力不足的情况,基于行人交互(crowd interaction)对值函数网络做了改进,通过行人角度网格(angel pedestrian grid)对行人之间的交互信息进行提取,并通过注意力机制(attention mechanism)提取单个行人的时序特征,学习得到当前状态与历史轨迹状态的相对重要性以及对机器人避障策略的联合影响,为之后多层感知机的学习提供先验知识;其次,依据行人空间行为(human spatial behavior)设计强化学习的奖励函数,并对机器人角度变化过大的状态进行惩罚,实现了舒适避障的要求;最后,通过仿真实验验证了人群环境中基于深度强化学习的移动机器人避障算法在人群密集的复杂环境中的可行性与有效性
人群环境中基于深度强化学习的移动机器人避障算法相关推荐
- 计算机位置隐私保护的书,移动群智感知中基于深度强化学习的位置隐私保护策略...
[摘要] 群智感知服务的广泛应用带来了个人隐私的泄漏,然而现存的隐私保护策略不能适应群智感知环境.针对相关缺陷,提出了一种移动群智感知中基于深度强化学习的隐私保护策略.该策略通过泛化任务,使得攻击者无 ...
- 基于深度强化学习的组合优化方法在工业应用中的实践
<统筹方法平话>中有一个例子曾被收录到语文课本中,讲"烧水泡茶"有五道工序:1.烧开水,2.洗茶壶,3.洗茶杯,4.拿茶叶,5.泡茶,其中前四道工序是泡茶的前提,且各道 ...
- Nat. Mach. Intell. | 基于深度强化学习寻找网络中的关键节点
今天给大家介绍哈佛大学Yang-Yu Liu课题组和加利福尼亚大学洛杉矶分校Yizhou Sun课题组发表在nature machine intelligence上的一篇文章"Finding ...
- ACL 2018 论文解读 | 基于深度强化学习的远程监督关系抽取
在碎片化阅读充斥眼球的时代,越来越少的人会去关注每篇论文背后的探索和思考. 在这个栏目里,你会快速 get 每篇精选论文的亮点和痛点,时刻紧跟 AI 前沿成果. 点击本文底部的「阅读原文」即刻加入社区 ...
- 通过图注意力神经网络进行多智能体游戏抽象_[读论文] AttnPath: 将图注意力机制融入基于深度强化学习的知识图谱推理中...
论文原文:Incorporating Graph Attention Mechanism into Knowledge Graph Reasoning Based on Deep Reinforcem ...
- 基于深度强化学习的区域化视觉导航方法
基于深度强化学习的区域化视觉导航方法 人工智能技术与咨询 本文来自<上海交通大学学报>,作者李鹏等 在环境中高效导航是智能行为的基础,也是机器人控制领域研究的热点之一.实现自主导航 ...
- 基于深度强化学习的电子商务平台动态定价
目录 1. 论文背景 2. 核心框架 3. 方法介绍 3.1 问题描述 3.2 定价动作模型 3.3 预训练 3.4 离线评估 4. 实验效果 1. 论文背景 Dynamic Pricing on E ...
- 基于深度强化学习的智能船舶航迹跟踪控制
基于深度强化学习的智能船舶航迹跟踪控制 人工智能技术与咨询 昨天 本文来自<中国舰船研究> ,作者祝亢等 关注微信公众号:人工智能技术与咨询.了解更多咨询! 0. 引 言 目前,国内外 ...
- 商简智能学术成果|基于深度强化学习的联想电脑制造调度(Lenovo Schedules Laptop Manufacturing Using Deep Reinforcement Learning)
获取更多资讯,赶快关注上面的公众号吧! 文章目录 摘要 背景介绍 传统方法无法解决现有挑战 解决方案 提升模型表达能力 针对复杂约束的掩码机制 快速模型训练 配置多目标调度优化 结论 本篇论文作为 ...
最新文章
- 魔法函数%matplotlib 解决matplotlib画图在Jupter/IPython中不显示
- r语言kmodes_聚类分析——k-means算法及R语言实现
- 保守官僚 诺基亚就这样迷失在智能机时代?
- 【操作系统/OS笔记09】线程、线程的实现、上下文切换、进程控制
- 搜狗浏览器数据备份/同步工具
- Python JavaScript 的数组去重
- Jenkins实现持续集成 上传远程服务器war 并执行sh脚本重启
- 计算机的文件怎么加密码怎么设置,文件夹怎么设置密码,教您怎么设置
- web前端开发--------CSS基础教程
- 为什么拼多多推广出价没人点击?新店铺怎么推广?
- leaflet 设置地图上某个标注位于页面最上层
- 如何缓解焦虑?做好这5件事,让你不再焦虑
- 《域渗透攻防指南》签名版预售来啦
- 天猫数据爬取解决找不到json文件的问题
- 查找字符串fing()函数
- 内涵段子爬取及re匹配
- javamail在linux环境中发送邮件问题总结
- python使用 pywin32 模块操作 excel,Python 操作 excel 系列之五
- Python的线程18 Condition类实现田径运动场景
- 【历史】- 一段关于 Unix、Linux 和 Windows 的暗黑史
热门文章
- Python Journey - Day4 - 字符串string
- XFS的网络文明建设
- windows10删除桌面右键菜单
- django调用python脚本返回_Django框架(九)—— 单表增删改查,在Python脚本中调用Django环境...
- !终端伪装测试之fuck校园网
- android 好的 钢琴软件,真正完美的android钢琴软件
- 2014秋江苏计算机二级,关于2014年秋季江苏省计算机等级考试报名通知
- HPE还将继续支持下一代Superdome GPU芯片
- 【ESP8266】烧录无线中继固件详细教学
- 和一可爱的漂亮的聪明的善良的MM聊天,聊赚钱的动机学说