论文精读 | slam中姿态估计的图优化方法比较
一、 摘要
对于位置环境中的自主导航问题,同步定位与建图(Simultaneous localization and mapping, SLAM)是一个非常重要的工具框架。根据SLAM字面含义可以得知,获取正确的环境表征和估计机器人正确的运动轨迹这两点在SLAM问题中至关重要。在解决优化估计问题上表现SOTA方法的主流思路是基于图优化的最小二乘,比较流行的算法框架有g2o、Ceres、GTSAM、SE-Sync等。作者这篇论文描述了这些方法并进行了对比测试。
二、 总体介绍
在SLAM领域刚刚起步的时候,基于滤波算法的SLAM霸占了很多年,因为PGO(Pose graph Optimization)存在处理效率的问题,而SLAM对实时性要求又比较高。到了现如今,由于计算机处理效率逐渐提高,PGO方法被提上了日程,越来越多高效的优化算法使得基于PGO的优化SLAM占据主流地位。
基于优化的SLAM方法主要分为两个部分:
- 第一部分就是根据传感数据的测量数据,建立新的观测与地图之间的约束(就是损失函数) ;
- 第二部分就是根据约束处理优化机器人位姿和地图信息。
以典型基于优化的SLAM问题来说:Pose-SLAM,它避免了建立一个明确的环境地图,目标是在给定闭环和里程约束条件下估计机器人的轨迹(相对姿态)。这些相对姿态测量通常通过IMU、lidar、camera或GPS获得,使用ego-motion、scan-registration、ICP等构建最小化视觉重投影误差(就是损失函数)。利用最流行的优化框架g2o、Ceres、GTSAM、SE- Sync等进行求解。但是没有论文在同一条件下对这些框架算法进行评估,本文的目的就是这个,在相同条件下,测试不同框架对不同问题的性能效果。
三、非线性位姿图优化方法
在Pose-SLAM的优化问题中,每个姿态图(pose graph)都由节点(node)和边(edge)组成,其中:
- 节点(node):对应于机器人在环境中的位姿,也是优化的目标;
- 边(edge):不同节点之间的空间约束。相邻节点之间的边是里程约束,其余边表示闭环约束。
下图展示了一个pose-graph可视化的结果,由于物体的运动在时间上连续,可以看到代表一些系列的位姿。
- 实线连接:时间相邻位姿,用于局部里程计(odometry)优化 ;
- 虚线连接:存在共视关系,即有些特征点在不同位姿下同时观察到,用于闭环(loop-closures)优化。
下面简述一个非线性位姿图优化的基本思路步骤 :
- 确定优化目标:在位姿图的所有约束条件下找到最小二乘误差的正确节点配置。一般情况下,可以定义为
- 优化求解:通过迭代优化算(Gauss-Newton、Levenberg-Marquardt等)可以得到问题最优解。主要想法是用上式在初始值附近的一阶泰勒展开来近似误差函数。一般来说,包括四个主要步骤:
其中,是所有图约束对应误差总和:
其中, C表示连接节点之间的索引对集合, 和 表示节点和之间的信息矩阵, 是非线性误差函数,用来模拟姿态 和如何满足测量 施加的约束。采用信息矩阵 和误差函数 对每一个约束进行建模。如下图所示
- 优化求解:通过迭代优化算(Gauss-Newton、Levenberg-Marquardt等)可以得到问题最优解。主要想法是用上式在初始值附近的一阶泰勒展开来近似误差函数。一般来说,包括四个主要步骤:
- 固定一个初始值;
- 将问题近似为凸问题;
- 对步骤2问题求解,并更新初始值;
- 重复步骤2-3直到收敛。
Pose-SLAM的优势:求解问题存在稀疏性,可以加快求解速度,并且对于初始状态的变化较为鲁棒
Pose-SLAM的缺点:对外点(outliers,亲切一点就是错的离谱的结果)不具有鲁棒性,另外,优化估计Rotation的过程是一个非凸优化问题,容易造成导致局部最优问题,且不保证全局最优问题。
四、优化框架介绍
- g2o
g2o是一个开源的通用框架,用于优化可以定义为图形的非线性函数,它的优点是易于扩展,高效,适用于广泛的问题。主要特点有:
- 可以与其他最先进的算法相媲美,同时具有高度的通用性和可扩展性;
- 通过利用稀疏连通性、图的特殊结构以及现代处理器的特点来实现高效计算;
- 该框架包含了3种不同的PGO算法:GaussNewton 、Levenberg-Marquardt、Powell’s Dogleg。
应用:ORB-SLAM的后端处理、SVO的visual odometry部分
- Ceres
Ceres Solver是一个开源的c++库,用于建模和解决大型、复杂的优化问题。它主要致力于解决非线性最小二乘问题(束平差和SLAM),但也可以解决一般的无约束优化问题。
- 该框架易于使用、可移植、广泛优化、低计算时间;
- Ceres的设计允许用户定义和修改目标函数和优化求解器;
- 实现的求解算法包括trust region solvers(Levenberg-Marquardt、Powell’s Dogleg)和line search solvers。
应用:OKVIS、VINS中的图优化问题
- GTSAM
GTSAM是一个开源c++库,它实现了机器人和计算机视觉应用的传感器融合。它可用于SLAM、视觉测程和SFM中的优化问题。
- GTSAM使用因子图来模拟复杂的估计问题,并利用其稀疏性来提高计算效率;
- 实现了Levenberg- Marquardt、Gauss-Newton的优化器。
应用:GTSAM与各种传感器前端一起使用,SVO的变体使用GTSAM作为里程计的后端。
- SE-Sync
SE-Sync的目标给定节点之间的相对变换的噪声测量的条件下,估计一组未知的姿态的值
- 主要应用于二维和三维几何估计;
- 改进了以往的方法,它利用了特殊的欧氏同步问题的一个新的(凸)半定松弛来直接搜索全局最优解;
- 采用truncated-Newton Riemannian Trust-Region method来寻找有效的姿态估计。
五、实验测试
实验标准:
- 评价标准:运行时间、损失结果、终止条件
- 评价数据集:合成数据集、真实数据集
实验环境:
- Lenovo ThinkPad P50 equipped with an octa-core Intel Core i7-6700HQ CPU operating at 2.60 GHz and 16 GB RAM
- Ubuntu20.04
优化配置:
- 算法:Levenberg- Marquardt;
- 迭代次数:最多100次;
- 停止迭代标准:达到最大迭代次数或相对误差阈值;
- 梯度下降率:0.01 。
测试结果:
- 部分优化结果(在INTEL、MIT两个数据集上)
- 整体测试统计结果
六、结论
本文比较了在SLAM中用于姿态估计的图优化算法。作者考虑了g2o、GTSAM、Ceres、SE-Sync四个主流优化框架。评估过程考虑了优化时间和优化结果,以表的形式给出了测试结果,发现:
- 与其他三种方法相比,SE-Sync在大多数数据集上优化时间最短;
- g2o优化时间最长,但在简单数据集上表现良好;
- Ceres易于使用,提供了很大的灵活性,而且相对较快;
- 除了在噪声干扰严重的数据集上,GTSAM的性能几乎和SE-Sync一样 。
并且作者建议:
对于数据关联差、噪声大和性能差的前端,最好使用SE-Sync作为后端。如果初始化较好,GTSAM表现和SE-Sync一样出色 。
对于比性能优秀的前端,在数据集相对简单、噪音很低的情况下,后端优化的选择就凭借个人喜好了。
本文是对论文《A Comparison of Graph Optimization Approaches for Pose Estimation in SLAM》的带读~
论文和论文精读文稿PDF版本点击下方就可以获取啦!
https://mp.weixin.qq.com/s/dhDobC7-IyLPar97T2wGBAhttps://mp.weixin.qq.com/s/dhDobC7-IyLPar97T2wGBA
论文精读 | slam中姿态估计的图优化方法比较相关推荐
- SLAM中姿态估计的图优化方法比较(g2o/Ceres/GTSAM/SE-Sync)
编辑 | 深蓝AI 点击下方卡片,关注"自动驾驶之心"公众号 ADAS巨卷干货,即可获取 后台回复[SLAM综述]获取视觉SLAM.激光SLAM.RGBD-SLAM等多篇综述! 本 ...
- 作为SLAM中最常用的闭环检测方法,视觉词袋模型技术详解来了
摘自:https://mp.weixin.qq.com/s/OZnnuA31tEaVt0vnDOy5hQ 作为SLAM中最常用的闭环检测方法,视觉词袋模型技术详解来了 原创 小翼 飞思实验室 今天 基 ...
- 遗传算法优化rbf神经网络自校正控制的初值_【技术帖】轻量化设计中的NVH性能自动优化方法...
摘 要:噪声.振动与声振粗糙度 (Noise,Vibration and Harshness,NVH)性能的自动优化是实现多学科联合优化的基础条件.以白车身模型的零件厚度作为设计变量,以针对动刚度性能 ...
- Android中对图片的内存优化方法
Android 中对于图片的内存优化方法 1. 对图片本身进行操作 尽量不要使用 setImageBitmap.setImageResource.BitmapFactory.decodeResourc ...
- 基于直线的最小非线性SLAM相机姿态估计方法
Minimal Non-linear Camera Pose Estimation Method Using Lines for SLAM Applications 1. 介绍 2. 非线性优化方法 ...
- CVPR 2020 论文大盘点-人体姿态估计与动作捕捉篇
本文盘点CVPR 2020 所有人体姿态估计(Human Pose Estimation).手势识别(Gesture Recognition).人体形状与姿态估计(Human Shape and Po ...
- 【论文笔记】—目标姿态估计—EPro-PnP—2022-CVPR
论文介绍 该论文被评为 CVPR 2022 最佳学生论文 . 将PnP位姿优化问题转变为预测位姿概率密度的问题. 对于一个基于PnP的物体位姿估计网络,可以通过反向传播位姿的概率密度从而学习物体的2 ...
- SLAM | 视觉SLAM中的后端:后端优化算法与建图模板
点击上方"AI算法修炼营",选择加星标或"置顶" 标题以下,全是干货 前面的话 前面系列一中我们介绍了,VSLAM 是利用多视图几何理论,根据相机拍摄的图像信息 ...
- 论文笔记20191022-平面姿态估计
1.Robust binocular pose estimation based on pigeon-inspired optimization 基于鸽子启发式优化的稳健双目姿势估计-2015 htt ...
最新文章
- python编写用户输入的是q么代码_Python课 #01号作业
- music算法原理_大话FMCW雷达之区域检测原理
- 【中级软考】什么是实时操作系统?(RTOS:Real Time Operating System)
- respberry pi3 上手随记
- Codeforces940(A-F)
- ant引入html页面,antdesign 中 使用 iconfont symbol方式引入图标不展示
- Android之提示This version of Android Studio cannot open this project, please retry with Android Studio
- mysql pydev_pydev-python 链接mysql数据库(mac系统)
- 解决win7检测不到第二个显示器的方法
- 随机函数_巧用随机函数,生成各种姓名组合。
- SpringCloud从入门到精通——微服务注册中心
- excel曲线拟合怎么弄
- tomcat映射本地磁盘路径
- 数据安全生命周期管理介绍(一)
- 关于Pascal和二项式系数
- Neo4j 重置密码
- SQL 增加或删除一列
- 学习Mathematica(四)——函数与绘图
- Java Swing 经典小游戏《飞机大战》———— (一)获取素材,创建窗口,添加滚动背景,双缓冲
- Emacs org 转换成freemind
热门文章
- 白左机器人_乔治高中 - George School | FindingSchool
- java lstm_人人都能看懂的LSTM介绍及反向传播算法推导(非常详细)
- nginx php.ini配置_Nginx下修改php.ini后重新加载配置文件命令
- loadrunner java_如何使用LoadRunner开发JAVA Vuser
- 还在维护吗_你的模具生锈了吗?来了解一下这些防锈维护事项
- php中now()的用法,PHP中的NOW()函数
- python 3.8 新特性_Python 3.8六大新功能
- android9谷歌推送,谷歌Android 9.0系统将统一推送以改善更新碎片化
- melogin.cn主页登录_melogin.cn登录官网
- 关闭加速渲染_“瀑布屏”旗舰 摩托罗拉Edge+渲染图曝光,Moto G8正式发布