【多视图几何】TUM 课程 第2章 刚体运动
课程的 YouTube 地址为:https://www.youtube.com/playlist?list=PLTBdjV_4f-EJn6udZ34tht9EVIW7lbeo4 。视频评论区可以找到课程所使用课件与练习题的下载地址。
课程第2章从李群与李代数的角度介绍三维空间的刚体运动。李群即常见的旋转矩阵、变换矩阵,李代数与李群对应,李代数 \(se(3)\) 是所有三维反对称阵的集合。
将李代数映射到李群,使得旋转与变换可微,并且消除了旋转矩阵的约束条件($ R^TR = I, det(R) = 1 $)对优化的约束,能够在无约束条件下进行位姿的优化。
1. 三维空间与刚体运动
三维空间是三维欧几里德空间(Euclidean Space)的简称,一般使用笛卡尔坐标系(Cartesian Coordinate System)描述欧式空间中的点,笛卡尔坐标描述是 $ (x, y, z) \in \mathbb{E}^3 $ 的形式,这种形式可以用 \(\mathbb{R}^3\) 定义。
于是使用三维向量 $ \mathbb{R}^3 $ 描述一个三维点坐标 $ \mathbb{E}^3 $。本笔记使用 \(\mathbb{R}^3\) 替代 $ \mathbb{E}^3 $,严格意义上将 \(\mathbb{E}^3\) 是笛卡尔坐标,$ \mathbb{R}^3 $ 是三维向量。
1.1 叉乘与反对称阵
叉乘(Cross Product)是将两个三维向量映射到一个三维向量:
\[ \times : \mathbb{R}^3 \times \mathbb{R}^3 \rightarrow \mathbb{R}^3 : u \times v = \begin{bmatrix} u_2v_3 - u_3v_2 \\ u_3v_1 - u_1v_3 \\ u_1v_2 - u_2v_1 \end{bmatrix} \in \mathbb{R}^3 \]
叉乘可以可以转化为一个矩阵与向量点乘的形式,方便计算:
\[ u \times v = \hat{u} \cdot v, \hat{u} = \begin{bmatrix} 0 \quad -u_3 \quad u_2 \\ u_3 \quad 0 \quad -u_1 \\ -u_2 \quad u_1 \quad 0 \end{bmatrix} \]
1.2 刚体运动
刚体运动是三维坐标到三维坐标的映射:
\[ g_t : \mathbb{R}^3 \rightarrow \mathbb{R}^3; X \mapsto g_t(X), t \in [0, T] \]
$ t $ 是时刻。
刚体运动保持范数(norm)与叉乘不变:
\[ | g_t(v) | = | v |, \forall v \in \mathbb{R}^3 \]
\[ g_t(u) \times g_t(v) = g_t(u \times v), \forall u, v \in \mathbb{R}^3 \]
由以上两个性质与极化恒等式(Polarization Identity)可知刚体运动也保持内积不变。三重积(Triple Product)也是保持变不变,三重积的几何意义是三个向量表示的平行六面体的体积,所以刚体运动保持体积不变。
\[ <g_t(u), g_t(v) \times g_t(w)> = <u, v \times w> \]
刚体运动可以表示为:
\[ g_t(x) = Rx + T \]
2. 李群与李代数
2.1 旋转矩阵的导数
在任意时刻的旋转矩阵都是正交的,$ R(t)R^T(t) = I, \forall t $,对这个式子左右求导:
\[ {d \over dt}(RR^T) = \dot RR^T + R {\dot R}^T = 0 \Rightarrow \dot RR^T = -(\dot RR^T)^T \]
所以 \(\dot RR^T\) 是一个反对称阵,所以在任意时刻存在一个向量 \(w(t) \in \mathbb{R}^3\) 与 $ \dot RR^T $ 对应:
\[ \dot R(t)R^T(t) = \hat w(t) \Leftrightarrow \dot R(t) = \hat w R(t) \]
上式表明了任意时刻 $ t $ 的旋转矩阵 \(R(t)\) 的导数 \(\dot R(t)\) 的计算方法——用一个反对称阵左乘旋转矩阵 \(R(t)\)。
0时刻的旋转矩阵 $ R(0) = I $,在0时刻附近展开:
\[ R(dt) = R(0) + dR = I + \hat w(0) dt \]
2.2 李群 \(SO(3)\) 与李代数 \(so(3)\)
李群(Lie Group)指连续可微的群,三维空间的旋转是连续的,所以特殊正交集 \(SO(3)\) 是三维旋转李群对应的矩阵表示。连续是关键。
Def.: A Lie group (or infinitesimal group) is a smooth manifold that is also a group, such that the group operations multiplication and inversion are smooth maps.
$ SO(3) $ 中的微分可以使用反对称阵逼近,反对称阵所在的群叫做李代数(Lie Algebra):
\[ so(3) \equiv \left\{ \hat w \right. \left| w \in \mathbb{R}^3 \right\} \]
李代数是李群在 \(I\) 处的切空间(Tangent Space)。$ I $ 对应的是0时刻,以0时刻为基准,认为0时刻不存在旋转。
2.2.1 指数映射
前面推导得到了 $ \dot R(t) = \hat w R(t) $ 的结论,解微分方程
\[ \begin{cases} \dot R(t) = \hat w R(t) \\ R(0) = I\end{cases} \]
得到
\[ R(t) = e^{\hat w t} = \Sigma_{n = 0}^{\infty}{ {(\hat w t)}^n \over n !} = I + \hat w t + {{(\hat w t)}^2\over 2!} + \dots \]
当 $ |w| = 1 $ 时 \(R(t)\) 是绕着轴 $ w \in \mathbb{R}^3 $ 的旋转,如果将时间 \(t\) 写入到 \(\hat w\) 中($ \hat w = \hat w t $),这样就得到了从李代数到李群的映射:
\[ exp: so(3) \rightarrow SO(3); \hat w \mapsto e^{\hat w} \]
2.2.2 对数映射
对数映射是将指数映射的逆映射,是从李群 $ SO(3) $ 到李代数 $ so(3) $ 的映射, 可以表示为
\[ log: SO(3) \rightarrow so(3); R \mapsto \hat w \]
当 $ R \ne I $ 时,
\[ \|w\| = {\cos}^{-1}\left. \right({trace(R) - 1\over 2}\left. \right), {w \over \| w \|} = {1 \over \sin(\|w\|)} \begin{bmatrix} r_{32} - r_{23} \\ r_{13} - r_{31} \\ r_{21} - r_{12} \end{bmatrix} \]
当 $ R = I $ 时,\[ w = 0 \]
2.2.3 罗德里格公式
指数映射部分将 \(R(t)\) 用一无穷级数表示,如何求取这个无穷级数呢?这就需要用到罗格里格公式(Rodrigues' Rotation Formula),对于 $ \hat w \in so(3) $:
\[ e^{\hat w} = I + {\hat w \over \| w \|}\sin(\| w \|) + {\hat w^2 \over \| w \|^2}(1- \cos(\| w \|)) \]
2.3 李群 \(SE(3)\) 与李代数 \(se(3)\)
$ SE(3) $ 表示刚体运动,包括旋转和平移,在齐次坐标下定义为:
\[ SE(3) \equiv \left\{ g = \begin{bmatrix} R \quad T \\ 0 \quad 1 \end{bmatrix}\left. \right| R \in SO(3), T \in \mathbb{R}^3 \right\} \subset \mathbb{R}^{4 \times 4}\]
旋转矩阵求导能够直接得出旋转矩阵的导数 $ \dot R(t) = \hat w R(t) $,但 $ SE(3) $ 不具有这种性质,为了保持表达形式的一致,仿照 \(SO(3)\) 与 \(so(3)\) 定义 \(se(3)\)。
$ g $ 是刚体变换映射:
\[ g: \mathbb{R} \rightarrow SE(3); g(t) = \begin{bmatrix} R(t) & T(t) \\ 0 & 1 \end{bmatrix} \in \mathbb{R}^{4 \times 4} \]
$ g $ 是一个 \(4 \times 4\) 的矩阵,但是并不是一个正交阵,不具备 $ g g^T = I $ 的性质,但是作为一个可逆矩阵 $ gg^{-1} = I \Rightarrow \dot g g^{-1} = (\dot g g)^{-1}$,然后就如下考虑:
\[ \dot g (t) g^{-1}(t) = \begin{bmatrix} \dot R R^T & \dot T - \dot R R^T T \\ 0 & 0\end{bmatrix} \in \mathbb{R}^{4\times4} \]
前面 $ SO(3) $ 部分可知 $ \dot R R^T = \hat w, \hat w\in so(3) $,定义一个新的向量 $ v(t) \equiv \dot T(t) - \hat w(t)T(t) $,于是有:
\[ \dot g (t) g^{-1}(t) = \begin{bmatrix} \hat w(t) & v(t) \\ 0 & 0\end{bmatrix} \equiv \hat \xi(t) \in \mathbb{R}^{4\times4} \]
进一步求 \(\dot g\):
\[ \dot g = \dot g g^{-1}g = \hat \xi g \]
公式中的 \(\hat\xi\) 称作 twist (twist 有旋转运动加平移运动的意思,可查 Screw Theory)。
\(se(3)\) 的定义:
\[ se(3) \equiv \left\{ \hat \xi = \begin{bmatrix} \hat w & v \\ 0 & 0 \end{bmatrix} \left. \right| \hat w \in so(3), v \in \mathbb{R}^3 \right\} \subset \mathbb{R}^{4 \times 4} \]
$ \hat \xi $ 是 twist,$ \xi \in \mathbb{R}^6 $ 称作 twist coordinates,两者的完整定义如下:
\[ \hat \xi \equiv { \begin{bmatrix} v \\ w \end{bmatrix} }^{\hat{}} \equiv \begin{bmatrix} \hat w & v \\ 0 & 0 \end{bmatrix} \in \mathbb{R}^{4\times4} \]
\[ \xi \equiv { \begin{bmatrix} v \\ w \end{bmatrix} } \equiv {\begin{bmatrix} \hat w & v \\ 0 & 0 \end{bmatrix}}^{\check{}} \in \mathbb{R}^{6} \]
$ v $ 是在 \(R\) 旋转后的坐标系的线速度,\(w\) 是角速度。
2.3.1 指数映射
求 \(se(3)\),解微分方程
\[ \begin{cases} \dot g(t) = \hat \xi g(t), \hat xi = const \\ g(0) = I \end{cases} \]
得
\[ g(t) = e^{\hat \xi t} = \Sigma_{n = 0}^{\infty} { (\hat \xi t)^n \over n !} \]
当 \(w = 0\) 时,
\[ e^{\hat \xi} = \begin{bmatrix} I & v \\ 0 & 1 \end{bmatrix} \]
当 \(w \ne 0\) 时,
\[ e^{\hat \xi} = \begin{bmatrix} e^{\hat w} & {(1 - e^{\hat w})\hat wv + ww^Tv \over \|w\|^2} \\ 0 & 1 \end{bmatrix} \]
2.3.2 对数映射
先利用 $ e^{\hat \xi} $ 左上角 \(3\times3\) 的矩阵计算出 \(w\) ,随后用右上角 \(3\times1\) 的式子计算 \(v\)。
3. 相机运动
相机是刚体,相机的运动是刚体运动,可以使用旋转和平移表示。
一般使用 \(g(t)\) 表示相机在 \(t\) 时刻相对世界坐标系的位置姿态:
\[ g(t) = \begin{bmatrix} R(t) & T(t) \\ 0 & 1 \end{bmatrix} \in SE(3) \]
一般定义相机在0时刻的坐标系为世界坐标系,在世界坐标系中一点的坐标为 \(X_0\),该点在 \(t\) 时刻的相机坐标系下的坐标为 \(X(t)\):
\[ X(t) = R(t) X_0 + T(t) \]
在齐次坐标系下:
\[ X(t) = g(t) X_0 \]
3.1 相机运动的链接
两个不同时刻 \(t_1, t_2\) 世界坐标系下的点 \(X_0\) 的坐标为 \(X(t_2), X(t_1)\),\(X(t_2), X(t_1)\) 之间的关系是:
\[ X(t_2) = g(t2, t1)X(t_1) \]
$ g(t_2, t_1) $ 表示 \(t_2\) 相对 \(t_1\) 的位姿,通过以下方程即可得到 \(g(t_2, t_1)\) 与 $ g(t_1), g(t_2) $ 的关系。
\[ \begin{cases} X(t_2) = g(t_2)X_0 \\ X(t_1) = g(t_1)X_0 \end{cases} \]
如果存在3个时刻 $ t_1, t_2, t_3 $ :
\[ X(t_3) = g(t_3, t_2) X_2 = g(t_3, t_2) g(t_2, t_1) X_1 = g(t_3, t_1)X_1 \]
\[ g(t_3, t_1) = g(t_3, t_2) g(t_2, t_1) \]
$ g(t_2, t_1) $ 的逆是 \(t_1\) 相对 \(t_2\) 的位姿 $ g(t_1, t_2) $:
\[ g(t_1, t_2)g(t_2, t_1)=I \Leftrightarrow g^{-1}(t_2, t_1)=g(t_1, t_2) \]
3.2 速度变换
对 $ X(t) = g(t) X_0 $ 求导:
\[ \dot X(t) = \dot g(t) X_0 = \dot g(t)g^{-1}(t)X(t) \]
定义
\[ \hat V(t) \equiv \dot g(t)g^{-1}(t) = \begin{bmatrix} \hat w(t) & v(t) \\ 0 & 0 \end{bmatrix} \in se(3) \]
于是
\[ \dot X(t) = \hat V(t)X(t) \]
在非齐次坐标系中
\[ \dot X(t) = \hat w(t) X(t) + v(t) \]
转载于:https://www.cnblogs.com/JingeTU/p/6390859.html
【多视图几何】TUM 课程 第2章 刚体运动相关推荐
- 【多视图几何】TUM 课程 第6章 多视图重建
课程的 YouTube 地址为:https://www.youtube.com/playlist?list=PLTBdjV_4f-EJn6udZ34tht9EVIW7lbeo4 .视频评论区可以找到课 ...
- 【多视图几何】TUM 课程 第3章 透视投影
课程的 YouTube 地址为:https://www.youtube.com/playlist?list=PLTBdjV_4f-EJn6udZ34tht9EVIW7lbeo4.视频评论区可以找到课程 ...
- Mysql系列课程--第三章 建表 插数据
数据库模型图 /班级表/ CREATE TABLE `class` (`c_no` int(11) NOT NULL AUTO_INCREMENT,`c_name` varchar(45) NOT N ...
- 国内首个三维重建系列视频课程,涉及SFM、立体匹配、多视图几何、结构光、单目深度估计等...
原文链接:国内首个三维重建系列视频课程,涉及SFM.立体匹配.多视图几何.结构光.单目深度估计等... 三维重建技术是计算机视觉的重要技术之一,基于视觉的三维重建技术通过深度数据获取.预处理.点云配准 ...
- 重磅!国内首个三维重建系列视频课程,涉及SFM、立体匹配、多视图几何、结构光、单目深度估计等(最新版)...
写在前面 感谢大家的一路陪伴与支持,这里赠送一张「3D视觉从入门到精通」知识星球优惠券,有效期两天,有需要的可以使用. 三维重建技术是计算机视觉的重要技术之一,基于视觉的三维重建技术通过深度数据获取. ...
- 终于来了,国内首个三维重建系列视频课程,涉及SFM、多视图几何、结构光、单目深度估计等...
三维重建技术是计算机视觉的重要技术之一,基于视觉的三维重建技术通过深度数据获取.预处理.点云配准与融合.生成物体表面等过程,把真实场景刻画成符合计算机逻辑表达的数学模型. 由于三维重建对图像.光学.成 ...
- 计算机视觉学习第5章——多视图几何
目录 一. 外极几何 1.1 简单数据集 1.2 用Matplotlib绘制三维数据 1.3 计算F:八点法 1.4 外极点和外极线 二.照相机和三维结构的计算 2.1 三角部分 2.2 由三维点计算 ...
- 阿里云【7天实践训练营】进阶路线——Day3:阿里云云计算助理工程师认证(ACA)课程3 ~ 4章
阿里云[7天实践训练营]进阶路线--Day3:阿里云云计算助理工程师认证(ACA)课程3 ~ 4章 第3章 : 掌握云数据库RDS 课时11:云数据RDS产品介绍 概要 基本信息 功能 RDS与自建数 ...
- 基于多视图几何方式的三维重建
写在前面 感谢我们「3D视觉从入门到精通」知识星球嘉宾为我们带来的主题为基于多视图几何方式的三维重建视频讲解,星球成员可免费观看学习.备注:作者来自武汉大学在读博士,精通多视图几何算法. 什么是知识星 ...
最新文章
- 适配器模式理解和使用
- 串行通信------字符串发送和十六进制发送
- 基于keras 的神经网络股价预测模型
- 精选CSDN的ACM-ICPC五星博客
- Cloud for Customer手机应用上传图片禁止从本地相册选择图片的核心代码
- URLEncoder 、URLDecoder 对中文转码解码使用
- POJ 3624 Charm Bracelet 0-1背包
- 使用pm2后台运行nodejs程序
- tomcat context 配置 项目部署
- vue路由配置src/router/index.js
- 4_while循环结构和breakcontinue
- WordPress主题插件Modown6.1绿色版+Erphpdown11.6等多插件
- 【OpenBMC 系列】3.bitbake介绍
- linux 取字符串的一部分,什么linux shell命令返回字符串的一部分?
- 数据治理-数据生命周期管理一
- OpenLayers 静态图(雷达拼图)叠加
- 如何做好虾皮跨境电商?关于Shopee店铺快速开单的真相!
- 大数据研究,不能“忽悠”
- Android “adb”不是内部或外部命令,也不是可运行的程序或批处理文件
- traits简单介绍