机器人导航两篇顶级会议论文解析

一.一种用于四旋翼无人机室内自主导航的卷积神经网络特征检测算法

标题:A Convolutional Neural Network Feature Detection Approach
to Autonomous Quadrotor Indoor Navigation

作者:Adriano Garcia, Sandeep S. Mittal, Edward Kiewra and Kanad
Ghose

来源:2019 IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS)

摘要

用于识别和定位室内结构特征点的目标检测技术,目前同样可以应用于四旋翼无人机室内自动导航。四旋翼无人机上搭载的前向单目相机拍摄的视频流会实时传输到外场的主机系统,并且在外场主机上运行了一套基于卷积神将网络的目标检测算法来识别一些特殊的特征点,例如死角、门和一些走廊的十字口。利用被识别物体周围边界框的像素级尺寸,使用支持向量回归(SVR)模型,可以准确估计到交叉口、终端和入口的距离,生成飞行控制命令,并且在飞行速度接近2m /s时实现一致的实时自主导航。

图1 区别于传统的图像处理方法,本文使用卷积神经网络来同时对结构特征点进行检测和定位,这使得我们的方法可以处理更多类的目标检测问题。图示为本文算法的结构流程,无人机飞行过程中的视频流和导航数据救人无人机API TX/RX节点,其中视频流输入到YOLO3结构特征点探测器节点并输出边界检测数据。在控制节点中,边界检测数据进入近邻估计算法并结合无人机导航数据进入导航算法流程,并计算得到无人机飞控指令。最后得到的指令同样通过无人机API接口传入到无人机,控制无人机行动。我们使用基于CNN的YOLO架构来训练和执行预测模型,实验证明这种做法可信度非常高并且可以持续的检测和定位结构特征点,并且平均速度可以达到25帧每秒。

图2 本文使用的CNN视觉模型是一种目标检测模型,该模型经过训练和可以对交叉口、死角和一些其他例如们和海报板等多种走廊特征进行检测和定位。我们之前的工作是使用图像处理方法来进行特征点检测,但这种方式不能很好的对光照条件进行很好的兼容。本文的CNN-based特征识别方法则没有这种限制,并且可以对目前进行的所有试验场景很好的兼容工作。本文用的YOLO3网络共有53个卷积层,batch_size为64,learning_rate设置为0.001。上图所示为使用YOLO网络来对目标进行边界提取标记。

图3 估计真实世界中相机到这些标记特征的距离是非常必要的,这样可以把目标检测的标记位置与真实世界中的位置进行对应,进而保证无人机控制模块可以产生准确的指令。我们使用相机校准技术来获得对应关系模型来讲图像平面像素长度转换到真实世界的距离值。我们需要记录实际的真值测量值并且分析检测到的特征点是如何在像素平面变化的。经过我们的实验,我们的YOLO检测系统可以检测和定位前向55m到2m之家你的距离。上图所示为深度值估计结果,经过统计分析,最高的误差达到3.4m,平均误差在0.75m。

图4 为了验证我们基于CNN系统的有效性,我们为YOLO_based的自主导航视觉系统在一系列不同的走廊场景进行了实际飞行测试,场景包括:直线飞行经过宽的和窄的走廊;飞行经过转弯;在多走廊路径中进行持续自动飞行。上述三图分别为平面多路径展示图以及测试结果统计表。经过测试,路径A中的最高时速比其他飞行过程中的大一些,这是因为无人机在两个拐点之间飞行了较长的距离,因此无人机有充足的时间加速到最高时速。在飞行测试过程中,发生了一些撞墙事件,但是都被控制节点很好的解决掉并且完成了整体的飞行。

二.基于先验雷达地图约束的视觉惯导定位

标题:Visual-Inertial Localization with Prior LiDAR Map
Constraints

作者:Xingxing Zuo, Patrick Geneva, Yulin Yang, Wenlong Ye, Yong
Liu, and Guoquan Huang

来源:IEEE/RSJ International Conference on Intelligent Robots
and Systems (IROS),2019

摘要

在本文中,我们开发了一种低成本的双目相机-惯导定位系统,该系统有效利用多状态约束卡尔曼滤波(MSCKF)的视觉惯性里程计同时利用先验雷达地图提供有界误差的三维导航。除了VIO中使用的标准的稀疏视觉特征点测量,在紧耦合的MSCKF更新中利用了之前的激光雷达地图上的视觉半直接法的全局注册,从而校正了累积误差。这种视觉和激光雷达点云之间的交叉模式约束得到了特别的解决。该方法在蒙特卡罗模拟和实际实验中都得到了验证,结果表明,通过不同的感知模式创建点云之间的激光雷达地图约束极大地改善了标准VIO并提供了有界误差性能。

图1. 提出的带有先验雷达地图约束的视觉惯导定位系统在EurocMac数据集上运行。先验的激光雷达地图是根据高度添加颜色的,而真值和估计的轨迹分别用青色和粉红色绘制。由一系列关键帧重建的半稠密点云以黑色表示。

图2.所提出的定位系统的数据流,双目和惯导测量可以从左面看到,所提出地图约束的子系统用红色框强调。

图3.没有深度细化的视觉半稠密重建(左)在房间的墙壁上有高水平的噪音。相比之下,深度细化的视觉半稠密重建(右)沿边界显示出较低的噪声(见插图)。这些点云是EurocMav V1 02中等序列的一个小子集。

表一.蒙特卡罗模拟参数

表二.具有不同层次的先验地图噪声的均方根误差

图5.合成Gazebo数据集的鸟瞰图。机器人长达836米的groundtruth轨迹用红色表示。机器人的最大速度设定为2.5 m/s。图6.0.03的噪声下标准MSCKF和具有先验激光雷达地图的MSCKF的方位和位置RMSE的仿真结果。

表三.对于不同段长度的相对位姿误差

图7.相对轨迹误差统计的箱线图。中间的盒子跨越了第一和第三个四分位数,而胡须是上限和下限。从颜色上看,带有激光雷达地图约束的平移误差最好。

表四.添加地图的MSCKF、标准MSCKF和VINS-Mono的变种在5段数据集上的平均绝对轨迹误差(左)。两个系统线程的时间信息:(I)稀疏视觉惯导里程计和(II)先验地图约束(右)。

机器人导航两篇顶级会议论文解析相关推荐

  1. 传感器标定两篇顶会论文解析

    传感器标定两篇顶会论文解析 一.在城市环境中的多个3D激光雷达的自动校准 标题:Automatic Calibration of Multiple 3D LiDARs in Urban Environ ...

  2. SLAM架构的两篇顶会论文解析

    SLAM架构的两篇顶会论文解析 一.基于superpoint的词袋和图验证的鲁棒闭环检测 标题:Robust Loop Closure Detection Based on Bag of SuperP ...

  3. 地图构建两篇顶级论文解析

    地图构建两篇顶级论文解析 一.基于声纳的密集水下场景重建 标题:Dense, Sonar-based Reconstruction of Underwater Scenes 作者:Pedro V. T ...

  4. 部分国外顶级会议论文没有关键词

    部分国外顶级会议论文没有关键词,我才发现. 举个例子:2016年,CVPR,You Only Look Once:Unified, Real-Time Object Detection,这篇会议论文, ...

  5. 关于SARS-CoV-2的十个问题,我们整理了20篇顶级期刊论文进行了回答

    过去一段时间,大家都在讨论关于SARS-CoV-2的各种问题,比如Omicron会重复感染吗?Omicron的致病性越来越弱吗?打疫苗到底有没有用?我们本着相信科学,相信Nature等顶级期刊论文的原 ...

  6. ACL-IJCAI-SIGIR顶级会议论文报告会(AIS 2022)笔记2:分析与可解释性

    诸神缄默不语-个人CSDN博文目录 录播视频地址:AIS 2022丨ACL-IJCAI-SIGIR顶级会议论文报告会回放视频公开啦 智源官网活动主页,有详细议程的介绍:ACL-IJCAI-SIGIR顶 ...

  7. PAMI-2021:5篇顶级GNN论文

    PAMI(IEEE Transactions on Pattern Analysis and Machine Intelligence),IEEE模式分析与机器智能汇刊,简称PAMI,是IEEE最重要 ...

  8. 两篇同年硕士论文高度雷同!电子科技大学回应:启动调查!

    公众号关注 "大鱼机器人" 设为 "星标",重磅干货,第一时间送达! 来源 | 澎湃新闻 转自| 双一流高校 澎湃新闻(www.thepaper.cn)近日接到 ...

  9. AIS 2022 | ACL-IJCAI-SIGIR顶级会议论文预讲会,现开启论文征集

    ‍SIGIR.ACL和IJCAI是信息检索.自然语言处理和人工智能领域最高级别的学术会议,三大会议囊括了全球人工智能领域,尤其是自然语言处理领域和信息检索领域的最新先进成果.今年5月至7月,SIGIR ...

最新文章

  1. 计算机的图形渲染机制
  2. Windows安装Zookeeper和Dubbo(单机版本)
  3. scalikejdbc 学习笔记(4)
  4. obs可以推到中转服务器吗,能否使用OBS(Open Broadcaster Software)、FMLE(Flash Media Live Encoder)等第三方软件进行推流?...
  5. android监控指纹信息变化,android监听指纹变化(解决反射思路在android10不生效的问题)...
  6. oracle怎么查找最大值,oracle – 在每个分区的列中查找最大值
  7. ATL(COM) 开发下 -- VS2010
  8. Android REMOTE_SUBMIX原理(九)
  9. 【学术分享】推荐一个免费下载外文文献的网站
  10. ffmpeg time_base详解
  11. SVM支持向量机原理及核函数
  12. 移动web网页开发——动画
  13. FIBOS社区发起人 响马:一个“极客硬核老炮儿”是怎样的?
  14. python实现 把列表中数字0移动到末尾
  15. 在苹果 M1 上运行 Linux 虚拟机变得容易了
  16. 文章总结:ASPLOS 2013 Architecture I
  17. HI3516DV300 图像输入
  18. 丰富的无线局域网技术
  19. Ubuntu18.04系统的安装及使用,不能开机,输入法不对等
  20. 谭浩强C++ 第四章

热门文章

  1. 阿里云如何将服务器添加至跳板机,如何将服务器添加至jumpsever
  2. java1.8新增超实用Map方法——Map.getOrDefault()和Map.value()方法详解
  3. 伍六七带你学算法——被忽视的数学公式
  4. 2022-2028年中国钢材市场投资分析及前景预测报告(全卷)
  5. Pyinstaller 打包 torch 后执行失败 OSError: could not get source code
  6. 2022-2028年中国内衣用热熔胶膜行业发展现状调查及市场分析预测报告
  7. NLP.TM | GloVe模型及其Python实现
  8. LeetCode中等题之区域和检索 - 数组可修改
  9. LeetCode简单题之删除排序链表中的重复元素
  10. 光谱投影颜色感知器件与围栅多桥沟道晶体管技术