点击上方“3D视觉工坊”,选择“星标”

干货第一时间送达

作者丨paopaoslam

来源丨泡泡机器人SLAM

标题:Continuous Scale-Space Direct Image Alignment for Visual Odometry from RGB-D Image

作者:Yassine Ahmine, Guillaume Caron, Fatima Chouireb, and El Mustapha Mouaddib

来源:2021 IEEE International Conference on Robotics and Automation (ICRA 2021)

编译:李健

审核:Zoe,王靖淇

摘要

本文提出了一种新的稠密 3D 图像对齐算法,该算法根据像素强度估计一对相机位姿之间的欧氏变换矩阵。其创新之处在于使用图像的尺度空间表示,在多分辨率图像金字塔的每个层级内进行自动尺度适应。这是通过在同一优化框架中不断优化尺度参数和相机位姿参数来完成的。本文所提出的方法显著地提高较大的帧间运动的直接图像对齐的鲁棒性。在TUM RGB-D 数据集上的各项实验表明,该算法优于前沿的基于固定尺度金字塔的对齐方法。

图1.  所考虑的算法目标是对齐一对图像{I1,  I2},其中对齐产生的图像是 GI2(W, λ) 和 I2(W)。基于固定尺度金字塔的方法无法对齐图像,因为它陷入局部最小值中,而基于优化尺度金字塔的方法能够成功对齐,因为它能够自适应调整图像平滑以抑制局部最小值。

图2. 上图:如图所示为每个自由度的代价函数与粒度最大金字塔层级的尺度空间自由度相结合。中间:λ = 5 和 λref = 1 的剖面图。底部:λ = 0.1 和 λref = 1 的剖面图(相当于固定比例的情况)

图3. 优化过程中归一化光度误差的变化(对于每个金字塔层)和相应的尺度参数。蓝线表示λ在每次迭代时的值(x轴),红色虚线表示λref。

表I. 本文提出的方法和PP-B方法在fr1/room序列上的RPE(相对位姿误差)统计。

表II. 本文提出的方法和PP-B方法在fr1/desk序列上的RPE(相对位姿误差)统计。

表III. 本文提出的方法和PP-B方法在fr2/desk序列上的RPE(相对位姿误差)统计。

表IV. 本文提出的方法和PP-B方法在fr2/desk序列上的RPE(相对位姿误差)均方根误差和平均值。

表V. 本文提出的方法和PP-B方法在fr1/desk序列上的RPE(相对位姿误差)均方根误差和平均值。

表VI. 本文提出的方法和PP-B方法在fr1/room序列上的RPE(相对位姿误差)均方根误差和平均值。

表VII.  本文提出的方法和PP-B方法在fr2/desk序列上的ATE(绝对轨迹误差)均方根误差和平均值。

图4. fr1/desk和fr1/room序列中不同图像步(image step,连续的一组图像)中的图像对示例

表VIII.  本文提出的方法和PP-B方法在fr1/desk序列上的ATE(绝对轨迹误差)均方根误差。

表IX.  本文提出的方法和PP-B方法在fr2/desk序列上的ATE(绝对轨迹误差)均方根误差。

图5. fr1/floor序列中谈及的图像步的ATE(绝对轨迹误差)均方根误差和平均值的变化(单位:m)

图6. fr1/desk序列中图像步为1时的相机速度(a)、相机加速度(b)和估计误差(c)随时间的变化

图7. fr1/desk序列中图像步为4时的相机速度(a)、相机加速度(b)和估计误差(c)随时间的变化

图8. 每个轨迹的绝对误差如图所示。对于 fr1/room 序列,考虑不同的图像步数:1 (a)、2 (b)、3 (d) 和 4  (e)。(c) 和 (f) 分别显示了图像步为 1 和 4 的估计轨迹以及真值(在 xy 平面上)。PP-B 和新的 OP-B 方法分别为红色和蓝色。真值轨迹为黑色。

图9. 每个轨迹的绝对误差如图所示。对于 fr1/desk 序列,考虑不同的图像步数:1 (a)、2 (b)、3 (d) 和 4  (e)。(c) 和 (f) 分别显示了图像步为 1 和 4 的估计轨迹以及真值(在 xy 平面上)。PP-B 和新的 OP-B 方法分别为红色和蓝色。真值轨迹为黑色。

图10. 每个轨迹的绝对误差如图所示。对于 fr2/desk 序列,考虑不同的图像步数:1 (a)、2 (b)、3 (d) 和 4  (e)。(c) 和 (f) 分别显示了图像步为 1 和 4 的估计轨迹以及真值(在 xy 平面上)。PP-B 和新的 OP-B 方法分别为红色和蓝色。真值轨迹为黑色。

图11. 每个轨迹的绝对误差如图所示。对于 fr1/floor 序列,考虑每张图像(a)和 2取1的图像(c), (b) 和 (d) 分别显示了图像步为 1 和 2的估计轨迹以及真值(在 xy 平面上)。PP-B 和新的 OP-B 方法分别为红色和蓝色。真值轨迹为黑色。

Abstract

In this paper, we propose a novel dense 3D image alignment algorithm that estimates the Euclidean transformation between pairs of camera poses from pixel intensities. The novelty consists in the automatic scale adaptation within each level of a multi-resolution image pyramid, using the scale-space representation of images. This is done through the continuous optimization of a scale parameter along with camera pose parameters in the same optimization framework. The proposed approach permits to significantly improve the robustness of the direct image alignment to large inter-frame motion. Various experiments on the TUM RGB-D dataset show that the proposed algorithm outperforms a fixed scale pyramidbased state-of-the-art alignment method.

如果你对本文感兴趣,请点击点击阅读原文下载完整文章

百度网盘提取码:iv7g

本文仅做学术分享,如有侵权,请联系删文。

干货下载与学习

后台回复:巴塞罗自治大学课件,即可下载国外大学沉淀数年3D Vison精品课件

后台回复:计算机视觉书籍,即可下载3D视觉领域经典书籍pdf

后台回复:3D视觉课程,即可学习3D视觉领域精品课程

3D视觉精品课程推荐:

1.面向自动驾驶领域的多传感器数据融合技术

2.面向自动驾驶领域的3D点云目标检测全栈学习路线!(单模态+多模态/数据+代码)
3.彻底搞透视觉三维重建:原理剖析、代码讲解、及优化改进
4.国内首个面向工业级实战的点云处理课程
5.激光-视觉-IMU-GPS融合SLAM算法梳理和代码讲解
6.彻底搞懂视觉-惯性SLAM:基于VINS-Fusion正式开课啦
7.彻底搞懂基于LOAM框架的3D激光SLAM: 源码剖析到算法优化
8.彻底剖析室内、室外激光SLAM关键算法原理、代码和实战(cartographer+LOAM +LIO-SAM)

9.从零搭建一套结构光3D重建系统[理论+源码+实践]

10.单目深度估计方法:算法梳理与代码实现

11.自动驾驶中的深度学习模型部署实战

12.相机模型与标定(单目+双目+鱼眼)

13.重磅!四旋翼飞行器:算法与实战

14.ROS2从入门到精通:理论与实战

15.国内首个3D缺陷检测教程:理论、源码与实战

重磅!3DCVer-学术论文写作投稿 交流群已成立

扫码添加小助手微信,可申请加入3D视觉工坊-学术论文写作与投稿 微信交流群,旨在交流顶会、顶刊、SCI、EI等写作与投稿事宜。

同时也可申请加入我们的细分方向交流群,目前主要有3D视觉CV&深度学习SLAM三维重建点云后处理自动驾驶、多传感器融合、CV入门、三维测量、VR/AR、3D人脸识别、医疗影像、缺陷检测、行人重识别、目标跟踪、视觉产品落地、视觉竞赛、车牌识别、硬件选型、学术交流、求职交流、ORB-SLAM系列源码交流、深度估计等微信群。

一定要备注:研究方向+学校/公司+昵称,例如:”3D视觉 + 上海交大 + 静静“。请按照格式备注,可快速被通过且邀请进群。原创投稿也请联系。

▲长按加微信群或投稿

▲长按关注公众号

3D视觉从入门到精通知识星球:针对3D视觉领域的视频课程(三维重建系列三维点云系列结构光系列手眼标定相机标定、激光/视觉SLAM、自动驾驶等)、知识点汇总、入门进阶学习路线、最新paper分享、疑问解答五个方面进行深耕,更有各类大厂的算法工程人员进行技术指导。与此同时,星球将联合知名企业发布3D视觉相关算法开发岗位以及项目对接信息,打造成集技术与就业为一体的铁杆粉丝聚集区,近5000星球成员为创造更好的AI世界共同进步,知识星球入口:

学习3D视觉核心技术,扫描查看介绍,3天内无条件退款

圈里有高质量教程资料、答疑解惑、助你高效解决问题

觉得有用,麻烦给个赞和在看~  

基于RGB-D图像的视觉里程计连续尺度空间直接图像对齐 (ICRA 2021)相关推荐

  1. 360VO:基于单个全景相机的视觉里程计

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 作者丨paopaoslam 来源丨 泡泡机器人SLAM 标题:360VO: Visual Odomet ...

  2. 基于双目事件相机的视觉里程计

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 论文标题:Zhou, Yi, Guillermo Gallego, and Shaojie Shen. ...

  3. python鱼眼图像识别_一种融合鱼眼图像与深度图像的动态环境视觉里程计方法与流程...

    本发明涉及移动机器人同步定位与地图构建(SLAM)技术领域,尤其是适用于动态环境的基于鱼眼图像与深度图像的视觉里程计方法. 背景技术: 定位技术是移动机器人实现各项复杂任务的技术基础.里程计便是一类简 ...

  4. 基于深度学习的智能车辆视觉里程计技术发展综述*--陈涛

    [1]陈涛, 范林坤, 李旭川,等. 基于深度学习的智能车辆视觉里程计技术发展综述[J]. 汽车技术, 2021(1):10. 本文内容: 介绍了基于模型的里程计研究现状 对比了常用智能车数据集, 将 ...

  5. 【自动驾驶】视觉里程计

    无人驾驶中的视觉里程计概念解读 里程计的概念: 在里程计问题中,我们希望测量一个运动物体的轨迹.这可以通过许多不同的手段来实现.例如,我们在汽车轮胎上安装计数码盘,就可以得到轮胎转动的距离,从而得到汽 ...

  6. 视觉里程计 第一部分:前30年的发展和理论基础

    视觉里程计 第一部分:前30年的发展和理论基础 VisualOdometry -Part I The First 30 Years and Fundamentals TaylorGuo, 2017年1 ...

  7. 视觉里程计 matlab实现,深度 | 视觉里程计---推导公式来了

    原标题:深度 | 视觉里程计---推导公式来了 作者:Taylor Guo 博客: 视觉里程计问题的公式推导 假设在时间k,通过相机移动,追踪环境图像.如果是单目相机,k时间上拍摄的一组图像表示为I0 ...

  8. Canny-VO: 基于几何3D-2D边缘对准的RGB-D视觉里程计

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 转自|当SLAM遇见小王同学 摘要 本文回顾了自由曲线配准的经典问 ...

  9. Line and Plane based Visual Odometry(基于线和平面的视觉里程计)

    1.Line and Plane based Visual Odometry 基于线和平面的视觉里程计 采用SO(3)流形约束平均偏移算法对结构规则(Manhattan frame)进行跟踪,得到无漂 ...

最新文章

  1. 第30本:《怎样解题》
  2. Android中实现Bitmap在自定义View中的放大与拖动
  3. 机器学习实战之k-近邻算法
  4. Oracle 数据字典表 -- SYS.COL$
  5. while用法_when 和 while 的用法区别
  6. Android 系统(82)---ART 和 Dalvik
  7. java 回文遍历_java 寻找全部回文
  8. linux oracle pam,Linux技术之深入Linux PAM 体系结构(一)
  9. 局域网交换机(Lan Switch)
  10. HTML简单的网页代码编写
  11. android的opengl教程,android opengl 教程
  12. mysql5.6卸载干净_Mysql完全干净卸载教程
  13. python实现抠图_python和opencv实现抠图
  14. 用计算机刻录光盘,图文详解怎么用电脑刻录光盘
  15. 阿里云OSS上传报错:InvalidAccessKeyIdError
  16. 1957:【12NOIP普及组】质因数分解
  17. 程序员的人生——应届生北漂的第三天
  18. 一篇全面的CSS布局学习指南 [译]
  19. AVD的CPU的选择
  20. 解决SimpleDateFormat线程不安全问题

热门文章

  1. 半自动化批量下载专利全文pdf傻瓜攻略
  2. 有效发布促成高效软文营销 | 媒介启航
  3. hive正则表达式反向引用
  4. ros入门真的没有那么难,我一般不说有手就行^_^
  5. 【论文笔记】End-to-end people detection in crowded scenes
  6. Ubuntu下C语言程序的编写
  7. iphone编辑过的录音怎么还原_如何从iPhone上恢复语音备忘录
  8. c语言指针知识点总结
  9. C#之Sokect通讯实例
  10. springboot引入国际化