VINS-Mono 理论详细解读——紧耦合后端非线性优化 IMU+视觉的残差residual、Jacobian、协方差、基于舒尔补的边缘化
本讲是VINS最核心部分了,前面经历了
1)视觉跟踪feature_tracker、IMU预积分integrationBase类;
2)初始化中SFM纯视觉估计滑动窗中所有帧的位姿和3D路标点深度、SFM与IMU预积分松耦合对齐求解初始化参数。
在完成前面的初始化环节后,本节将进行第3部分,基于滑动窗的紧耦合后端非线性优化:将视觉约束、IMU约束、闭环约束放到一个大的目标函数中进行非线性优化,求解出滑动窗口中所有帧的PVQ、bias等。
在视觉约束和IMU约束中,基本思想是找到优化状态向量,然后通过视觉残差和IMU测量残差分别对状态向量求导,获得视觉和IMU预积分的Jacobian和协方差矩阵。
阅读本文所需知识储备:
1、最小二乘、梯度下降法、牛顿与高斯-牛顿与LM关系总结
2、《视觉SLAM十四讲精品总结》4:非线性优化g2o(BA基础)
3、IMU预积分integrationBase类
目录
一、VIO残差函数的构建
1、需要优化的状态向量:
2、目标函数为:
二、视觉约束(细致)
1.视觉重投影误差residual(归一化平面)
2、优化变量
3、Jacobian
4、协方差
三、IMU约束(粗略,祥细见之前)
1、残差:
2、优化变量:
3、IMU测量残差公式推导
4、残差对状态量的Jacobian
5、残差对状态量的协方差
四、基于舒尔补的边缘化
1、论文部分
2、基本公式
3、舒尔补
4、marg后形成的先验
5 具体例子
5.1 原来的信息矩阵H的构成
5.2 舒尔补后形成新的信息矩阵new_H,并构造为先验
5.3 新测量信息和先验构成新的系统
一、VIO残差函数的构建
1、需要优化的状态向量:
滑动窗口内IMU状态(PVQ、加速度bias、陀螺仪bias)、IMU到Camera的外参、m+1个3D路标点逆深度。
第一个式子是滑动窗口内所有状态量,n是关键帧数量,m是滑动窗内所有观测到的路标点总数,维度是15*n+6+m。特征点逆深度为了满足高斯系统。
第二个式子xk是在第k帧图像捕获到的IMU状态,包括位置,速度,旋转(PVQ)和加速度偏置,陀螺仪偏置。
第三个式子是相机外参。
注意:xk只与IMU项和Marg有关;特征点深度也只与camera和Marg有关;
2、目标函数为:
视觉惯性BA:这三项分别为边缘化的先验信息、IMU的测量残差、视觉的重投影误差
BA优化模型分为三部分:
1、Marg边缘化残差部分(滑动窗口中去掉位姿和特征点约束)代码中使用Google开源的Ceres solver解决。
2、IMU残差部分(滑动窗口中相邻帧间的IMU产生)
3、视觉误差函数部分(滑动窗口中特征点在相机下视觉重投影残差)
二、视觉约束(细致)
这部分要拟合的目标可以通过重投影误差约束,求解的是对同一个路标点的观测值和估计值之间的误差,注意是在归一化平面上表示。
1.视觉重投影误差residual(归一化平面)
相关自变量是:该路标点被两帧观察到的相机帧位姿、Cam和IMU之间相对位姿、路标点在第一帧的逆深度。
当某路标点在第i帧观测到并进行初始化操作得到路标点逆深度,当其在第j帧也被观测到时,估计其在第j帧中的坐标为:
此时的视觉残差为:(左侧为根据i帧反推估计的位置,右侧为观测值)
逆深度参数化
逆深度作为参数原因:1)观测到的特征点深度可能非常大,难以进行优化;2)可以减少实际优化的参数变量;3)逆深度更加服从高斯分布。这里特征点的逆深度在第i帧初始化操作中得到。
论文中:
上面的公式是传统的针孔相机模型,这里用的是单位半球体的相机观测残差。是一个鱼眼相机。
在相机的归一化平面上比较残差,再将视觉残差投影到单位球面的正切平面上。由于视觉残差的自由度是2,所以我们将残差向量投影到切平面上。
在第i帧第一次观测到第l个路标点,在第j帧中对该路标点进行观测的残差为:
第一个式子就是残差的表达式,第二个式子是鱼眼相机反投影函数将观测到的像素坐标转换成单位向量的观测值数据,b1和b2是此单位向量的切平面上的一组基。第三个式子是重投影估计模型。其实VINS代码中也可以使用普通的针孔相机模型。
2、优化变量
包括两个时刻的状态量、外参,以及逆深度
值得注意的是:和纯视觉不同的是,待优化的状态量中的旋转平移都是IMU系到w系,而不是Camera到w系。
状态量特征:
1、待优化量和IMU约束中待优化量有重叠,再次体现了紧耦合。
2、和IMU不同的是,IMU每次优化的状态量是相邻两帧的,但是视觉优化的2帧不一定是相邻的,因此用i,j表示。
3、Jacobian
求解Jacobian就是用视觉残差对上述7个状态变量进行求导。
方法一:崔博直接给出答案
2)
方法二:深蓝学院详细推导
4、协方差
void Estimator::setParameter()
{for (int i = 0; i < NUM_OF_CAM; i++){tic[i] = TIC[i];ric[i] = RIC[i];}f_manager.setRic(ric);ProjectionFactor::sqrt_info = FOCAL_LENGTH / 1.5 * Matrix2d::Identity();ProjectionTdFactor::sqrt_info = FOCAL_LENGTH / 1.5 * Matrix2d::Identity();td = TD;
}
三、IMU约束(粗略,祥细见之前)
1、残差:
状态量传播预测与IMU预积分的残差。
2、优化变量:
IMU的第i、j时刻下的p位置,v速度,Q旋转(PVQ),两个偏置ba,bw
之前对IMU预积分进行了详细讲解。参考:VINS-Mono 代码详细解读——IMU离散中值预积分
3、IMU测量残差公式推导
简单来说,如果每一帧IMU都要相对于第一帧求位姿,计算量很大;考虑将PVQ积分公式改为相对第i时刻的姿态。
原PVQ积分公式:
基于预积分的PVQ积分公式
预积分量为:
最新的PVQ积分公式变为:
IMU测量残差e为:
4、残差对状态量的Jacobian
这里直接给出结果,如果想看详细推导,参考:VINS-Mono 代码详细解读——IMU预积分的残差、Jacobian和协方差 processIMU()+intergrationBase类+imu_factor.h
对应位置补充上这个J的矩阵块就行了,其他位置还是0。一共分为四大模块:
整个残差对某个变量求导;
例如: 指的是
5、残差对状态量的协方差
四、基于舒尔补的边缘化
为什么进行边缘化操作?
如果仅仅从前后两帧图像计算相机位姿,速度快但是精度低;但是采用全局优化BA,连接所有图像帧,精度高但是复杂度高。
采用滑动窗,固定数量的帧进行优化,这样能够保证精度和速度。既然是滑动窗,在滑动的过程中会有新的图像进来,旧的图像离开,所谓边缘化就是为了删除图像,但是把图像信息约束保留下来。
1、论文部分
为了防止pose和特征的个数的复杂度随着时间不断增长,引入边缘。
化,在移除位姿时将关联的约束转化为先验放入优化问题中。
为了限制基于优化的VIO计算复杂度,引入边缘化。有选择地从滑动窗口中将IMU状态xK和特征λ1边缘化,同时将对应于边缘状态的测量值转换为先验。
分为两种情况,
1、一种是倒数第二帧如果是关键帧的话,将最旧的pose移出Sliding Window,将最旧帧关联的视觉和惯性数据边缘化掉。把第一个老关键帧及其测量值被边缘化;Margin_Old作为先验值。
2、如果倒数第二帧不是关键帧的话,那么就只剔除倒数第二帧的视觉观测,而不剔除它的IMU约束。原因是边缘化保证关键帧之间有足够视差而能够三角化足够多的地图点。并且保证了IMU预积分的连贯性。
为了保持系统的稀疏性,我们不会边缘化非关键帧的所有测量值。
2、基本公式
我们根据运动模型和观测模型建立H矩阵(高斯牛顿法中的JJT)的过程其实就是根据概率图模型(多元高斯分布)建立各个节点变量间的信息矩阵(协方差矩阵的逆)的过程,而边缘化则是去掉概率图中的某一个节点后信息矩阵会发生怎样的变换的问题。
基于高斯牛顿的非线性优化理论可知,H*delta_x=b可以写成:
其中,delta_xa和delta_xb分别是希望marg掉的部分和保留部分。
VINS中需要边缘化滑动窗口中的最老帧,目的是希望不再计算这一帧的位姿或者与其相关的路标点,但是希望保留该帧对窗口内其余帧的约束关系。我们基于与移除状态相关的所有边缘化测量值构造一个先验。新的先验项被添加到现有的先验项中。
3、舒尔补
4、marg后形成的先验
xa为需要marg的变量,假设为相机pose,我们更关心如何求解希望保留的xb,而不再求解xa(即marg的变量改为0,左乘时左上是0),这里是要变化为上三角。
即:new_H*delta_xb=new_b;
形成新的信息矩阵new_H具体流程:
注意:去掉了x1,但是之前和x1相连的所有量x2 x3 x4 x5 在marg掉x1后变得两两相连。
5 具体例子
5.1 原来的信息矩阵H的构成
上述最小二乘问题,对用的高斯牛顿求解为:
矩阵乘法公式写成连加:
雅克比J和信息矩阵H的稀疏性:由于每个残差只和某几个状态量有关,因此,雅克比矩阵求导时,无关项的雅克比为 0。
将五个残差的信息矩阵加起来,得到样例最终的信息矩阵 Λ, 可视化如下
5.2 舒尔补后形成新的信息矩阵new_H,并构造为先验
5.3 新测量信息和先验构成新的系统
参考文章:
VINS-Mono理论学习——后端非线性优化 by Manii
VINS-mono详细解读 by 极品巧克力
VINS-Mono之后端非线性优化 (目标函数中视觉残差和IMU残差,及其对状态量的雅克比矩阵、协方差递推方程的推导) by Hansry
深蓝学院手写VIO课程
https://blog.csdn.net/iwanderu/article/details/104729332
VINS-Mono 理论详细解读——紧耦合后端非线性优化 IMU+视觉的残差residual、Jacobian、协方差、基于舒尔补的边缘化相关推荐
- 一文详解单目VINS论文与代码解读目录
本文旨在对前一阶段学习vins-mono开源框架的总结.结合暑假秋招之前报名的深蓝学院的<从零开始手写VIO>课程,本文从VIO原理以及开源代码分析两部分进行详细介绍.PS:提升代码能力最 ...
- vins 解读_VINS-mono详细解读
VINS-mono详细解读 极品巧克力 前言 Vins-mono是香港科技大学开源的一个VIO算法,https://github.com/HKUST-Aerial-Robotics/VINS-Mono ...
- VINS-mono详细解读与实现
VINS-mono详细解读 VINS-mono详细解读 前言 Vins-mono是香港科技大学开源的一个VIO算法,https://github.com/HKUST-Aerial-Robotics/V ...
- 3D激光SLAM:LOAM 论文--算法详细解读
3D激光SLAM:LOAM 论文--算法详细解读 LOAM简介 论文里面的符号表示 算法部分 激光雷达里程计 A 特征点提取 B 找特征点的匹配对 C 运动估计 lidar 建图 测试结果 LOAM是 ...
- Madgwick算法详细解读
Madgwick算法详细解读 极品巧克力 前言 接上一篇文章<Google Cardboard的九轴融合算法>. Madgwick算法是另外一种九轴融合的方法,广泛应用在旋翼飞行器上,效果 ...
- 刚刚,OpenStack 第 19 个版本来了,附28项特性详细解读!
刚刚,OpenStack 第 19 个版本来了,附28项特性详细解读! OpenStack Stein版本引入了新的多云编排功能,以及帮助实现边缘计算用例的增强功能. OpenStack由一系列相互关 ...
- 提升不止一点点,Dubbo 3.0 预览版详细解读
Dubbo 自 2011 年 10 月 27 日开源后,已被许多非阿里系的公司使用,其中既有当当网.网易考拉等互联网公司,也不乏中国人寿.青岛海尔等大型传统企业.更多用户信息,可以访问Dubbo @G ...
- 个性化联邦学习PFedMe详细解读(NeurIPS 2020)
关注公众号,发现CV技术之美 本文介绍一篇 NeurIPS 2020 的论文『Personalized Federated Learning with Moreau Envelopes』,对个性化联邦 ...
- 熵、联和熵与条件熵、交叉熵与相对熵是什么呢?来这里有详细解读!
熵是一个很常见的名词,在物理上有重要的评估意义,自然语言处理的预备知识中,熵作为信息论的基本和重点知识,在这里我来记录一下学习的总结,并以此与大家分享. 信息论基本知识 1.熵 2.联和熵与条件熵 3 ...
- 经典神经网络论文超详细解读(三)——GoogLeNet InceptionV1学习笔记(翻译+精读+代码复现)
前言 在上一期中介绍了VGG,VGG在2014年ImageNet 中获得了定位任务第1名和分类任务第2名的好成绩,而今天要介绍的就是同年分类任务的第一名--GoogLeNet . 作为2014年Ima ...
最新文章
- 连接统计学、机器学习与自动推理的新兴交叉领域——因果科学读书会再起航...
- 5秒钟后自动跳转!!!!
- 公司--ajax获取数据
- [转]Sql Server 分页存储过程
- SAP Spartacus ComponentData的提前subscription
- 【Pytorch神经网络实战案例】16 条件WGAN模型生成可控Fashon-MNST模拟数据
- 数据结构与算法(一) 线性表之顺序表
- 本地数据库_干货|本地数据库调用的实现案例
- 反射根据每一列的列名获取List T 中的列值
- netframework有什么用_为什么.NET Web 应用推荐使用 await、async异步编程?
- android7添加小工具,为Android应用添加桌面小工具(App Widget)
- 触摸屏驱动开发——转载
- 香港传媒高层访团莅临深之蓝参观访问
- html图标隐藏,教你如何隐藏统计图标,两个隐藏统计图标的HTML代码
- Eclipse Mars2中Augular2开发环境的搭建过程记录
- 第39级台阶回溯算法c语言,回溯39级台阶
- 四核处理器_一千块普通办公电脑配置清单,还是四核处理器,能玩TX全家桶
- 关于XShell下载安装和连接Ubuntu(linux)
- Vue 事件修饰符.self的用法
- 一些android论坛
热门文章
- 无疆_炎戎的2011跨年总结
- Netlimiter 3.0 注册码
- 拍牌神器是怎样炼成的(二)--- 键鼠模拟之AutoIt
- 打jar包和使用jar包
- 基于Perclos&改进YOLOv7的疲劳驾驶DMS检测系统(源码&教程)
- Unity-Behavior Designer详解
- [转载]系统提示:“您可能是微软盗版的受害者”的解决方法
- cmd命令行怎样运行python,在CMD命令行中运行python脚本的方法
- 浅学socket及iOS中的AsyncSocket框架
- linux 监控平台介绍