第四讲---第五讲学习笔记如下:

视觉SLAM十四讲学习笔记-第四讲-李群与李代数基础和定义、指数和对数映射_goldqiu的博客-CSDN博客

视觉SLAM十四讲学习笔记-第四讲-李代数求导与扰动模型_goldqiu的博客-CSDN博客

视觉SLAM十四讲学习笔记-第四讲-Sophus实践、相似变换群与李代数_goldqiu的博客-CSDN博客

视觉SLAM十四讲学习笔记-第五讲-相机模型_goldqiu的博客-CSDN博客

视觉SLAM十四讲学习笔记-第五讲-图像和实践_goldqiu的博客-CSDN博客_global shutter

前三讲总结:

视觉SLAM十四讲学习笔记---前三讲学习笔记总结之SLAM的作用、变换和位姿表示_goldqiu的博客-CSDN博客

第四讲:

总结:

1.在SLAM中, 位姿作为状态变量是未知的,需要解决什么样的相机位姿最符合当前观测数据这样的问题。一种典型的方式是把它构建成一个优化问题,求解最优的R, t,使得误差最小化。旋转矩阵自身是带有约束的(正交且行列式为1)。它们作为优化变量时,会引入额外的约束,使优化变得困难。通过李群——李代数间的转换关系能够把位姿估计变成无约束的优化问题,简化求解方式。

2. 外积引入了∧符号,将一个向量变成了反对称矩阵。同理,对于任意反对称矩阵,亦能找到一个与之对应的向量,把这个运算用符号∨表示。(向量加了∧符号变成反对称矩阵,矩阵加了∨符号变成对应的向量)

3. 经过公式推导:每对旋转矩阵求一次导数,只需左乘一个 ϕ(t)∧矩阵(反对称矩阵)即可。最终有:

说明在 t = 0 附近,旋转矩阵可以由 exp (ϕ0∧t)计算出来,即旋转矩阵 R 与另一个反对称矩阵 ϕ0∧t 通过指数关系发生了联系。我们可以知道:给定某时刻的R,就能求得一个ϕ,它描述了R在局部的导数关系。ϕ正是对应到SO(3) 上的李代数so(3);李代数(ϕ)到李群(R)是指数关系,而李群(R)到李代数(ϕ)是对数关系。

4. ϕ是一种李代数。SO(3)对应的李代数是定义在R3上的向量,记作ϕ,每个ϕ都可以生成一个反对称矩阵;而se(3)可以理解成由一个平移加上一个so(3)元素构成的向量。

5. so(3)实际上就是由旋转向量组成的空间,而指数映射即罗德里格斯公式。通过指数映射,把so(3)中任意一个向量对应到了一个位于SO(3)中的旋转矩阵。反之,如果定义对数映射,也能把SO(3)中的元素对应到so(3)中。SO(3)与so(3)的结论和前面的旋转向量与旋转矩阵很相似,而指数映射即是罗德里格斯公式。旋转矩阵的导数可以由旋转向量指定,指导着如何在旋转矩阵中进行微积分运算。总结如下图:

6. 李代数计算使用Sophus库,其使用方法也是网上查找库使用说明。

7. 在单目视觉中有用到相似变换群 Sim(3),其李代数 sim(3) 元素是一个7维向量ζ。

更正:

  1. Sophus库的基本使用操作:
int main(int argc, char **argv) {// 沿Z轴转90度的旋转矩阵Matrix3d R = AngleAxisd(M_PI / 2, Vector3d(0, 0, 1)).toRotationMatrix();// 或者四元数Quaterniond q(R);Sophus::SO3d SO3_R(R);              // Sophus::SO3d可以直接从旋转矩阵构造Sophus::SO3d SO3_q(q);              // 也可以通过四元数构造// 二者是等价的cout << "SO(3) from matrix:\n" << SO3_R.matrix() << endl;cout << "SO(3) from quaternion:\n" << SO3_q.matrix() << endl;cout << "they are equal" << endl;// 使用对数映射获得它的李代数Vector3d so3 = SO3_R.log();cout << "so3 = " << so3.transpose() << endl;// hat 为向量到反对称矩阵cout << "so3 hat=\n" << Sophus::SO3d::hat(so3) << endl;// 相对的,vee为反对称到向量cout << "so3 hat vee= " << Sophus::SO3d::vee(Sophus::SO3d::hat(so3)).transpose() << endl;// 增量扰动模型的更新Vector3d update_so3(1e-4, 0, 0); //假设更新量为这么多Sophus::SO3d SO3_updated = Sophus::SO3d::exp(update_so3) * SO3_R;cout << "SO3 updated = \n" << SO3_updated.matrix() << endl;cout << "*******************************" << endl;// 对SE(3)操作大同小异Vector3d t(1, 0, 0);           // 沿X轴平移1Sophus::SE3d SE3_Rt(R, t);           // 从R,t构造SE(3)Sophus::SE3d SE3_qt(q, t);            // 从q,t构造SE(3)cout << "SE3 from R,t= \n" << SE3_Rt.matrix() << endl;cout << "SE3 from q,t= \n" << SE3_qt.matrix() << endl;// 李代数se(3) 是一个六维向量,方便起见先typedef一下typedef Eigen::Matrix<double, 6, 1> Vector6d;Vector6d se3 = SE3_Rt.log();cout << "se3 = " << se3.transpose() << endl;// 观察输出,会发现在Sophus中,se(3)的平移在前,旋转在后.// 同样的,有hat和vee两个算符cout << "se3 hat = \n" << Sophus::SE3d::hat(se3) << endl;cout << "se3 hat vee = " << Sophus::SE3d::vee(Sophus::SE3d::hat(se3)).transpose() << endl;// 最后,演示一下更新Vector6d update_se3; //更新量update_se3.setZero();update_se3(0, 0) = 1e-4;Sophus::SE3d SE3_updated = Sophus::SE3d::exp(update_se3) * SE3_Rt;cout << "SE3 updated = " << endl << SE3_updated.matrix() << endl;return 0;
}

其主要步骤如下:

a. 用旋转矩阵或者四元数定义李群

b. 通过李群的对数映射获得李代数。

c. 在SLAM中,增量扰动模型很关键,对扰动向量进行对数映射,并左乘到原矩阵,就完成了增量扰动的更新。

注意:对于so3和se3都操作都是类似的,在程序中由于对乘法运算发进行了重载,重载功能中完成了相关运算,所以调库编程比实际计算要简单得多。

2. 轨迹误差的评估:需要有一条估计的轨迹和一条真实的轨迹,真实的轨迹一般叫做groundtruth,一般是采用高精度设备事先去测得的。主要代码如下:

 // compute rmsedouble rmse = 0;for (size_t i = 0; i < estimated.size(); i++) {Sophus::SE3d p1 = estimated[i], p2 = groundtruth[i];double error = (p2.inverse() * p1).log().norm();rmse += error * error;}rmse = rmse / double(estimated.size());rmse = sqrt(rmse);

这里计算的是绝对轨迹误差(Absolute Trajectory Error, ATE),这是每个位姿李代数的均方根误差(Root-Mean-Squared Error, RMSE)。具体步骤是按照公式计算出每个位姿李代数,然后再做均方根。

第五讲:

总结:

1.单目相机对应的是针孔相机模型,而双目和RGB-D有对应的模型。相机由于透镜的存在和组装的误差存在畸变。

2.相机把三维世界中的信息转换成了一张由像素组成的照片,存储在计算机中,作为后续处理的数据来源。在数学中,图像可以用一个矩阵来描述;而在计算机中,它们占据一段连续的磁盘或内存空间,可以用二维数组来表示。然而计算机并不能表达实数空间,所以需要对下标和图像读数在某个范围内进行量化(类似于模拟到数字的概念)。在常见的灰度图中,用 0~255 的整数(一个 unsigned char或1 个字节)来表达图像的灰度读数。那么,一张宽度为 640 像素、高度为 480 像素分辨率的灰度图就可以表示为:

unsigned char image[480][640] //二维数组表达图像

在程序中,图像以二维数组形式存储。它的第一个下标是指数组的行,而第二个下标则是列。在图像中,数组的行数对应图像的高度,而列数对应图像的宽度。当访问某一个像素时,需要指明它所处的坐标。像素坐标系原点位于图像的左上角,X 轴向右,Y 轴向下(也就是u,v* 坐标)。如果还有第三个轴—Z 轴,根据右手法则,Z 轴向前。这种定义方式是与相机坐标系一致的。图像的宽度或列数,对应着X 轴;而图像的行数或高度,则对应着它的Y 轴。根据这种定义方式,访问一个位于 x,y 处的像素,那么在程序中应该是:

unsigned char pixel = image[y][x];  //访问图像像素

它对应着灰度值 I(x,y) 的读数。

3. 在 RGB-D 相机的深度图中,记录了各个像素与相机之间的距离。

4. 彩色图像的表示则需要通道(channel)的概念。在计算机中,用红色、绿色和蓝色这三种颜色的组合来表达任意一种色彩。于是对于每一个像素,就要记录其 R、G、B 三个数值,每一个数值就称为一个通道。最常见的彩色图像有三个通道,每个通道都由 8 位整数表示。在这种规定下,一个像素占据 24 位空间。在 OpenCV 的彩色图像中,通道的默认顺序是 B、G、R。也就是说,当得到一个 24 位的像素时,前 8 位表示蓝色数值,中间 8 位为绿色,最后 8 位为红色。如果还想表达图像的透明度,就使用 R、G、B、A 四个通道。

5. OpenCV提供了大量的开源图像算法,是计算机视觉中使用极广的图像处理算法库。其如何处理图像可以网上查找。如果电脑上有GPU并且安装了相关依赖项,OpenCV会把GPU加速打开。

6. 图像去畸变:通过cv::Undistort() 可以进行图像去畸变,但是得先进行相机内参的标定,这块opencv也提供了成熟的接口。可以参考以前写的相机内参标定的文章:

goldqiu:二十.激光、视觉和惯导LVIO-SLAM框架学习之相机内参标定

7. OpenCV实现的SGBM算法(Semi-global Batch Matching)可以对双目相机进行算法处理。

视觉SLAM十四讲学习笔记-第四讲---第五讲学习笔记总结---李群和李代数、相机相关推荐

  1. 视觉SLAM十四讲学习笔记-第七讲-视觉里程计-三角测量和实践

     专栏汇总 视觉SLAM十四讲学习笔记-第一讲_goldqiu的博客-CSDN博客 视觉SLAM十四讲学习笔记-第二讲-初识SLAM_goldqiu的博客-CSDN博客 视觉SLAM十四讲学习笔记-第 ...

  2. 视觉SLAM十四讲学习笔记-第七讲-视觉里程计-对极几何和对极约束、本质矩阵、基础矩阵

    专栏系列文章如下:  专栏汇总 视觉SLAM十四讲学习笔记-第一讲_goldqiu的博客-CSDN博客 视觉SLAM十四讲学习笔记-第二讲-初识SLAM_goldqiu的博客-CSDN博客 视觉SLA ...

  3. 视觉SLAM十四讲学习笔记-第六讲学习笔记总结(1)---非线性优化原理

    第六讲学习笔记如下: 视觉SLAM十四讲学习笔记-第六讲-非线性优化的状态估计问题_goldqiu的博客-CSDN博客 ​​​​​​视觉SLAM十四讲学习笔记-第六讲-非线性优化的非线性最小二乘问题_ ...

  4. 视觉SLAM十四讲学习笔记---前三讲学习笔记总结之SLAM的作用、变换和位姿表示

    经过半年学习SLAM相关知识,对SLAM系统有了一些新的认识,故回看以前的学习记录,做总结和校正. 前三讲学习笔记如下: 视觉SLAM十四讲学习笔记-第一讲_goldqiu的博客-CSDN博客 视觉S ...

  5. 视觉SLAM十四讲学习笔记-第七讲-视觉里程计-特征点法和特征提取和匹配实践

    专栏系列文章如下: 视觉SLAM十四讲学习笔记-第一讲_goldqiu的博客-CSDN博客 视觉SLAM十四讲学习笔记-第二讲-初识SLAM_goldqiu的博客-CSDN博客 视觉SLAM十四讲学习 ...

  6. 视觉SLAM十四讲学习笔记-第六讲-非线性优化的实践-高斯牛顿法和曲线拟合

    专栏系列文章如下: 视觉SLAM十四讲学习笔记-第一讲_goldqiu的博客-CSDN博客 视觉SLAM十四讲学习笔记-第二讲-初识SLAM_goldqiu的博客-CSDN博客 视觉SLAM十四讲学习 ...

  7. 视觉SLAM十四讲学习笔记-第六讲-非线性优化的非线性最小二乘问题

    专栏系列文章如下: 视觉SLAM十四讲学习笔记-第一讲_goldqiu的博客-CSDN博客 视觉SLAM十四讲学习笔记-第二讲-初识SLAM_goldqiu的博客-CSDN博客 视觉SLAM十四讲学习 ...

  8. 视觉SLAM十四讲学习笔记-第六讲-非线性优化的状态估计问题

    专栏系列文章如下: 视觉SLAM十四讲学习笔记-第一讲_goldqiu的博客-CSDN博客 视觉SLAM十四讲学习笔记-第二讲-初识SLAM_goldqiu的博客-CSDN博客 视觉SLAM十四讲学习 ...

  9. 视觉SLAM十四讲学习笔记-第四讲-Sophus实践、相似变换群与李代数

    专栏系列文章如下: 视觉SLAM十四讲学习笔记-第一讲_goldqiu的博客-CSDN博客 视觉SLAM十四讲学习笔记-第二讲-初识SLAM_goldqiu的博客-CSDN博客 视觉SLAM十四讲学习 ...

最新文章

  1. 用android做体质计算器,Android入门项目(一):BMI体质指数计算器
  2. Java基础课程---将一个字符串反转,将字符串中指定部分进行反转,比如,abcdefg, 反转为abfedcg...
  3. 解决VS2013+IE11调试DevExpress ASP.NET MVC的性能问题
  4. 数据结构 树的遍历(递归遍历练习)
  5. iocomp iPlot使用说明4 通道对象
  6. 计算机网络在办公自动化的应用,浅析计算机网络在办公自动化中的作用
  7. 语音信号处理(赵力)作业答案第8章——语音合成
  8. ESP32 INMP441麦克风驱动
  9. 各种路由器接口与连接方法
  10. Visual Studio 2015官方汇总包括下载和视频
  11. 当前读和快照读的区别
  12. 好消息,高清版谷歌卫星地图终于可以正常使用了
  13. spacy中en_core_web_sm安装问题
  14. Oracle 12c新特性-多租户的维护管理
  15. vue使用vue-video-player实现web视频直播展示m3u8格式
  16. 十年阿里P6大牛谈外包!
  17. 微信聊天记录备份:当前网络状况复杂和连接失败的解决办法
  18. 八个步骤教你做好会议现场管理
  19. 小白学习三维检测和三维语义理解(3D-understanding)持续更新中。。
  20. C++ 11的移动语义 - 清晰的示例及浅显的说理

热门文章

  1. Etl之HiveSql调优(left join where的位置)
  2. kafka之六:为什么Kafka那么快
  3. Apple Watch问与答
  4. 【转】雷军自曝创业第一年:掏自己的钱创业成功率最高
  5. 项目管理修炼之道之估算工作
  6. [九度][何海涛] 旋转数组的最小数字
  7. Oracle VM + Windows2003 Server 配置
  8. 计算机作曲 研究生 武汉音乐学院,计算机音乐作曲(武汉音乐学院2021年招收攻读硕士学位研究生考试大纲)...
  9. java知识点3(null、引用相关知识(自己理解))
  10. STM32L0 读取芯片温度与当前供电电压 STM32L051C8T6