【本学期选修国科大计算机视觉课程,本人方向也是cv,因此想通过博客方式记录课程中比较重要的点,巩固并且进行一些扩展学习】

【从本章节开始由申抒含老师为我们讲述相关知识】

【本章节内容针对相机模型和多视几何进行讲解】

接下来我们将主要针对以下内容进行介绍:

射影空间

小孔相机成像模型

基本矩阵F,如8点法等

一. 计算机视觉发展历史

从Marr最开始的图像处理到Hinton提出深度学习,甚至延续到现在,也就40年的时间,也就意味着计算机视觉此时只是处于一种前期发展,更需要人们去投入心思发现其奇妙之处。

特征提取是针对点线面进行分析,提取所需特征值。

2.5维深度图是指可见区域,如一堆方块放置在一边,你只能看到正面对着的那一块。

子空间学习大意是指通过投影,实现高维特征向低维空间的映射,是一种经典的降维思想。绝大多数的维数约简(降维,投影)算法都算是子空间学习,如PCA、LDA、LPP、LLE等;

在Poggio时期,流行寻找更加好的空间分类器

深度学习这边就不多加介绍,包括VGG,Imception等,后期有机会会对其模块进行介绍。

现计算机视觉使用范围很广,同样也意味着我们方向的多样性,但是主要还是针对三维图像的复原,包括三维城市,三维动作捕捉等

二. 射影空间

我们这边通过一个图进行学习。

x为投影呈现的二维,X为射影投影之后的,真实呈现的三维模型。

最后我们用来表示3D空间点和2D图像点

但是问题来了,如果存在一个无限远的点,我们应该如何表示?

• 在一条直线上只有唯一一个无穷远点

• 在一个平面上,所有的无穷远点组成一条直线,称为该平面的无穷远直线

三维空间中的所有无穷远点组成的一个平面,称为这个空间的无穷远平面
n维欧式空间加入无穷远元素,并对有限元素和无穷远元素不加区分,则他们共同构成n维射影空间,记作Ρn
齐次坐标是射影空间的坐标表达方式

【非齐次到齐次】

【齐次到非齐次】

其中:

1.齐次坐标在相差一个尺度时等价,即w=1
2.无穷远点的齐次坐标w=0

三.相机模型

                                                                     

三维计算机视觉坐标系: 1. 世界坐标系、2. 相机坐标系

 相机模型——内参数矩阵

 p是指光轴穿过图像的中心位置!

四. 多视几何

单幅图像的投影方程:

多幅图像的投影方程:

Fundamental matrix(基础矩阵)

• 两视图的极几何约束(epipolar geometry)可以用一个 3x3矩阵描述,称为基本矩阵(fundamental matrix)F
表达了image 1中的齐次坐标点p与image 2中p的极线之间的映射关系
image 2中点p的极线:Fp

图像对应点间的极几何约束关系可以表达为:

八点法,顾名思义就是寻找八个点进行观测。

注意:当空间点位于空间同一平面时,产生退化情况,无法求解

Essential matrix(本质矩阵)

寻找最小配置解的意义:

图像匹配点中不可避免的存在外点,因此使用RANSAC进行鲁棒估计。
RANSAC计算流程:
1. 随机选r对匹配点计算模型;
2. 计算模型的一致集(所有符合模型的匹配点构成的集合);
3. 步骤1-2循环n次;
4. 使用最大一致集中的所有匹配点重新计算模型。
假定两幅图像中正确匹配点所占比例为p=0.5,则经过n次RANSAC后找到正确模型的概率为(r为最小数据点个数):
p=0.5, r=4, n=500时,正确的模型未被找到的概率为1×10-14
p=0.5, r=5, n=500时,正确的模型未被找到的概率为1×10-7
p=0.5, r=6, n=500时,正确的模型未被找到的概率为1×10-4

【推荐书籍】

【本章节没有讲其他特别高深的问题,因为省略了一些数学推导原理,仅作为大致了解内容,不足之处,敬请谅解】

计算机视觉——三维视觉 I相关推荐

  1. 北京内推 | 京东AI研究院计算机视觉实验室招聘三维视觉算法研究型实习生

    合适的工作难找?最新的招聘信息也不知道? AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职! 京东 AI 研究院 京东 AI 研究院(https://air.jd.co ...

  2. 计算机视觉|投影与三维视觉

    这一篇将学习投影与三维视觉,沿用上一篇 计算机视觉|针孔成像,相机内外参及相机标定,矫正的重要性 摄像机内参数矩阵M.畸变参数.旋转矩阵R.平移向量T以及但影响矩阵H.回顾放射和投影变换,并使用POS ...

  3. 揭秘三维视觉之结构光原理

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 知乎作者David LEE 本文的目的就是对结构光(Structu ...

  4. CVPR 2021|三维视觉相关论文汇总

    作者丨Tom Hardy@知乎 来源丨https://zhuanlan.zhihu.com/p/355149511 编辑丨3D视觉工坊 1.GDR-Net: Geometry-Guided Direc ...

  5. 字节跳动招聘【三维视觉】算法实习生

    关注公众号,获取更多AI领域发展机会 岗位要求 - 计算机.电子.自动化等相关专业 - 了解三维视觉基础理论,在VSLAM/VIO.SfM.视觉定位.三维重建.姿态估计.3D deep learnin ...

  6. 旷视SLAM组负责人刘骁:三维视觉与机器人

    点击我爱计算机视觉标星,更快获取CVML新技术 大家好,我是旷视研究院SLAM组负责人刘骁,很高兴能和大家分享机器人领域一些有关三维视觉技术的思考. 这次分享的主题集中在SLAM与三维重建两方面,大纲 ...

  7. ppt 胡事民 计算机图形学_从相机标定到SLAM,极简三维视觉六小时课程视频(附PPT)...

    谭平教授是加拿大西蒙弗雷泽大学副教授.不久前他与浙江大学合作了一系列三维视觉课程,内容涵盖相机标定.多视几何等多个方面.机器之心简要介绍了该系列课程,希望能够对读者学习三维视觉技术有所帮助. 课程内容 ...

  8. 港中深、华为联合培养,韩晓光课题组招收三维视觉数字人方向博士生

    来源:机器之心 学校简介 香港中文大学(深圳)以创建一所立足中国.面向世界的一流研究型大学为己任,办学特色是国际化的氛围.中英并重的教学环境.书院制传统.通识教育.新型交叉学科设置和以学生为本的育人理 ...

  9. 港科大教授权龙:三维视觉重新定义人工智能安防...

    近日,由雷锋网 & AI掘金志主办的「第二届中国人工智能安防峰会」在杭州召开. 峰会现场,香港科技大学教授,CVPR 2022.ICCV 2011大会主席,Altizure创始人权龙教授发表了 ...

最新文章

  1. python编码与存储读取数据(数组字典)
  2. go hive skynet_MMORPG游戏服务器技术选型参考-Go语言中文社区
  3. 28.2. AndroidManifest.xml
  4. git推送出现fatal: the remote end hung up unexpectedly
  5. debian之自启动程序
  6. 【产品 设计】入门 - 工具篇 - Sketch + Skala Preview
  7. python-ImageDraw
  8. alreader 2 android,AlReader2
  9. 原生android tv 盒子,超强大的安卓7.0电视盒子是什么体验!
  10. python PIL Image 图片叠图、拼接,图片透明度调整 案例
  11. 顺丰科技架构升级之路
  12. PIP安装本地离线包whl
  13. 天琴协议_天琴座:新秀背后
  14. 汽车芯片TJA1057GTK/3高速 CAN 收发器3 毫米 x 3 毫米 x 0.85 毫米
  15. 【Vue】解决 Vue 视图不刷新和组件循环引用不加载问题
  16. Pycharm专业版下载、安装、与Anaconda配置、中文化及字体设置、Cracking(自行翻译)方法
  17. 记录第一次因为技术出差(自嘲一番吧)
  18. 学习centos第八天--网络命令查看
  19. 网中人《shell十三问》简体版整理
  20. Linux删除文件常用的几种措施

热门文章

  1. 驰骋BPM系统-表单引擎-流程引擎 2020年大换装
  2. OpenFOAM-v2006重叠网格挖洞问题研究以及overset代码解析(二)PATCH是什么类型的patch?
  3. 对云计算机的想法,我对云计算技术的看法
  4. python unicode编码转换中文_python实现unicode转中文及转换默认编码的方法
  5. 笔记本选购2018.9
  6. oracle 图片 显示不出,Sql Server 中image类型迁移到Oracle 中Blob类型出现图片显示不出来,why????请博客们帮忙 | 学步园...
  7. 北京航空航天大学计算机系考研复试上机真题及答案---2014
  8. P5431 【模板】乘法逆元2
  9. 9种常用的软件容错处理方式
  10. warning: function returns address of local variable(函数参数返回错误)