点击上方“3D视觉工坊”,选择“星标”

干货第一时间送达

作者丨HawkWang

来源丨计算摄影学

今天我将介绍一种很震撼的技术:角膜成像系统。

让我们先看看美女视频吧:

你看到了吗,只要相机足够清晰,我们完全可以通过人眼反射获得当前相机无法直接观测到的场景信息!

这也就是今天我想介绍的技术——角膜成像系统——的关键思想来源。

哥伦比亚大学的Nishino和 Nayar在2004年发表了论文 The World in an Eye,第一次提出了角膜成像系统。

在这篇论文中,他们详细阐述了角膜成像系统的几何模型,角膜缘的图像定位,角膜的三维位姿确定。然后他们详细的分析了角膜成像系统的焦散、分辨率等信息,还展示了一些角膜成像系统的真实应用:捕获场景全景视图、甚至定位人的注视物体等。

作者在项目主页上展示了两个让人印象深刻的视频:通过角膜成像系统拍摄的两段视频,准确的步骤到了人眼真正观察到的核心场景的视频:

现在让我们仔细顺着作者的思路,来看看其中的细节。

一. 折反射成像系统与人眼物理模型

折反射成像系统是一种特殊的成像系统,让我摘录一段Wikipedia的定义:

折反射光学系统是一种将折射和反射结合在一个光学系统中的光学系统,通常通过透镜(屈光镜)和曲面镜(折射镜)。折反射组合用于聚焦系统,如探照灯、前照灯、早期灯塔聚焦系统、光学望远镜、显微镜和长焦镜头。其他使用透镜和反射镜的光学系统也被称为“折反射”,例如监视折反射传感器。

下面是一个典型示例:

绝大多数折反射镜头都有一个特点,即:成像器件(例如传感器)和光学器件是紧密绑定在一起的。

而角膜成像系统的作者却敏锐的观察到,人眼+对着人眼拍摄的相机,也构成了一个折反射光学系统,只不过此时成像器件和光学反射系统不再是绑定在一起的,当眼球转动时,整个成像系统的光路会相应的发生改变。

所以让我们先来看看人眼的物理模型吧,从下图我们可以看到,人眼前几层的关键组成部分又角膜、瞳孔、虹膜、巩膜。其中,角膜的反射能力是最强的,它恰好形成了我们折反射成像系统的反射镜。

我们可以将它建模成为一个椭球面:

作者引用一些资料指出,对于正常成年人,tb基本上等于2.18mm,底部半径rL一般是5.5mm,椭球顶部的曲率半径是7.8mm,椭球的偏心率为0.5。作者的后续实验就是建立在这样的数据之上的,他们还指出即便人与人有些微的差别,也不会影响最终的结论。

二. 定位眼球位姿

2.1 定位角膜缘

为了定位眼球的位姿,首先得定位角膜缘在图像上的位置,如下图所示红色椭圆。

我觉得这个问题在今天看来已经有很多高级的解决方案了,比如现在很多小同学也会找一堆数据集,分分钟训练一个高质量的角膜分割模型(虽然效率及泛化性如何有待商榷 )。但在2004年,作者想要做的是用一种非常简洁有效,可解释的方式来定位角膜缘。考虑到角膜正面观察基本上是一个圆形,因此对任意方向的观察者来说,基本上可以用一个椭圆来描述角膜缘,因此这里需要寻找的就是椭圆在图像上的 中心点、长短轴半径、旋转角度,这几个参数。

因此作者将下面这个积差分操作作用到图像上,并求解使之响应最大化的参数,来达到定位椭圆的目的。这样做的好处是,检测结果不会受到眼睑遮挡的影响,准确度是比较好的。

这里是作者列出的检测结果,准确度还是挺不错的:

当然,我觉得如果采用轮廓检测以及霍夫变换,也能达到在眼部图像中寻找角膜缘的目的,感兴趣的读者不妨一试。

2.2 定位角膜的三维位姿

接下来,作者想要做的是定位角膜相对于相机,在三维空间中的位姿。

先从位置讲起,我们可以首先定位眼角膜模型中,角膜与相机之间的平均距离d,如下图所示。

简单的把这个系统看成是一个透视投影,可以将d表示为下式,其中rL=5.5mm,f是用像素表示的相机焦距,rmax是刚才通过检测角膜缘得到的椭圆长轴半径,也是用像素值来表述。

相应的,我们可以通过图像上的椭圆中心,反推出在相机三维坐标系中,角膜底部中心的X/Y坐标,至此角膜的三维定位完成。

作者对某个受试者,在5种不同已知距离上分别采集了不同注释方向的10幅图像,并验证上面定位方式的误差,结果如下,总体来说误差是小于5%的。

接下来,就要定位姿态了。我们看到上图中,正是因为角膜相对相机有一个偏转角度,才使得正投影为原型的角膜,在图像上实际上形成了一个椭圆。通过简单的三角运算,可以求得这个角度为:

到此为止,我们知道了角膜的两个方向角,一个是通过定位角膜缘图像得到的旋转角,一个是角膜底部平面和相机平面的旋转角,这就相当于定位了眼球的姿态了。

三. 角膜成像系统的进一步分析

有了前面的铺垫,作者进一步分析了整个角膜成像系统的下面几个特征:

  • 视点轨迹(焦散表面)

  • 视场角

  • 分辨率

  • 对极几何

这里面的数学和光学知识挺多,我们就直接看看一些比较容易理解的点吧:

首先,角膜成像系统的视场角是大于眼球主人的视场角的,这从上图可以看的出来。所以,即便是眼球主人自己都不曾留意的场景中的部分信息,我们都可以通过角膜成像系统恢复出来。

另外,可以从上图看到越是接近视线方向,分辨率越高。这意味着我们通过角膜成像系统得到的图像的分辨率分布,实际上和眼球主人的主观感觉是一致的。

三. 实验和应用展示

通过上面的模型,作者展示了可以通过眼球图像恢复出场景全景图,并进一步通过视线角度以及人眼FOV,获得眼睛的主人真正在关注的场景画面,如下图所示:

你可以看到,当相机和角膜的相对位姿不一样时,极坐标展开时的参数是不一样的,但最终都准确的捕捉到了人的真正关注场景。

下面是更多的例子:

你也已经从文章开头看到作者展示的动态视频了,第一次看到时我真的拍案叫绝!

作者甚至还展示了两眼构成的立体角膜成像系统:

这样就使得我们可以一定程度上恢复场景的三维结构,当然作者也提到由于相机捕捉到的画面分辨率不足,所以只能粗略恢复很近的物体的三维结构

四. 总结

今天为你展示了哥伦比亚大学的Nishino和 Nayar教授的研究成果,能够通过人眼的反射进行非视线成像,获取到场景的关键信息,还能够获取到人眼的感兴趣场景画面。

如今,相机的解析力越来越高,画面越来越清晰。而且,现在超分辨率技术也得到了充分的研究,我就检索到一篇2017年的文章,在搞角膜成像系统的超分辨率,限于篇幅原因,我就不详细展开了。

总之,我感觉今天介绍的技术实用性真的越来越有了,像下面这样拍一张照片就恢复出美女的关注点,不再是实验室的设想了。下次你走在路上假装没有盯对面的美女时,小心被人发现哦,哈哈!

五. 参考资料

今天的文章主要参考了:

  • CMU 2017 Fall Computational Photography Course 15-463, Lecture 26

  • Nishimo and Nayar, “Corneal Imaging System: Environment from Eyes,” IJCV 2006

  • Nishimo and Nayar, “The World in an Eye,” 2004

  • 项目主页上的示例图,以及讲义:cs.columbia.edu/CAVE/pr

  • 维基百科关于折反射系统和马克苏托夫望远镜的介绍:

  • https://en.wikipedia.org/wiki/Catadioptric_system

  • https://en.wikipedia.org/wiki/Maksutov_telescope

本文仅做学术分享,如有侵权,请联系删文。

干货下载与学习

后台回复:巴塞罗自治大学课件,即可下载国外大学沉淀数年3D Vison精品课件

后台回复:计算机视觉书籍,即可下载3D视觉领域经典书籍pdf

后台回复:3D视觉课程,即可学习3D视觉领域精品课程

3D视觉工坊精品课程官网:3dcver.com

1.面向自动驾驶领域的多传感器数据融合技术

2.面向自动驾驶领域的3D点云目标检测全栈学习路线!(单模态+多模态/数据+代码)
3.彻底搞透视觉三维重建:原理剖析、代码讲解、及优化改进
4.国内首个面向工业级实战的点云处理课程
5.激光-视觉-IMU-GPS融合SLAM算法梳理和代码讲解
6.彻底搞懂视觉-惯性SLAM:基于VINS-Fusion正式开课啦
7.彻底搞懂基于LOAM框架的3D激光SLAM: 源码剖析到算法优化
8.彻底剖析室内、室外激光SLAM关键算法原理、代码和实战(cartographer+LOAM +LIO-SAM)

9.从零搭建一套结构光3D重建系统[理论+源码+实践]

10.单目深度估计方法:算法梳理与代码实现

11.自动驾驶中的深度学习模型部署实战

12.相机模型与标定(单目+双目+鱼眼)

13.重磅!四旋翼飞行器:算法与实战

14.ROS2从入门到精通:理论与实战

15.国内首个3D缺陷检测教程:理论、源码与实战

16.基于Open3D的点云处理入门与实战教程

重磅!3DCVer-学术论文写作投稿 交流群已成立

扫码添加小助手微信,可申请加入3D视觉工坊-学术论文写作与投稿 微信交流群,旨在交流顶会、顶刊、SCI、EI等写作与投稿事宜。

同时也可申请加入我们的细分方向交流群,目前主要有3D视觉CV&深度学习SLAM三维重建点云后处理自动驾驶、多传感器融合、CV入门、三维测量、VR/AR、3D人脸识别、医疗影像、缺陷检测、行人重识别、目标跟踪、视觉产品落地、视觉竞赛、车牌识别、硬件选型、学术交流、求职交流、ORB-SLAM系列源码交流、深度估计等微信群。

一定要备注:研究方向+学校/公司+昵称,例如:”3D视觉 + 上海交大 + 静静“。请按照格式备注,可快速被通过且邀请进群。原创投稿也请联系。

▲长按加微信群或投稿,加微信:dddvision

▲长按关注公众号

3D视觉从入门到精通知识星球:针对3D视觉领域的视频课程(三维重建系列、三维点云系列、结构光系列、手眼标定、相机标定、激光/视觉SLAM自动驾驶等)、知识点汇总、入门进阶学习路线、最新paper分享、疑问解答五个方面进行深耕,更有各类大厂的算法工程人员进行技术指导。与此同时,星球将联合知名企业发布3D视觉相关算法开发岗位以及项目对接信息,打造成集技术与就业为一体的铁杆粉丝聚集区,近6000星球成员为创造更好的AI世界共同进步,知识星球入口:

学习3D视觉核心技术,扫描查看介绍,3天内无条件退款

圈里有高质量教程资料、答疑解惑、助你高效解决问题

觉得有用,麻烦给个赞和在看~  

非视线成像:角膜成像系统相关推荐

  1. 非视线成像 - 把墙角变为相机

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 我已经为你介绍了基于飞秒摄影.基于WIFI.以及基于角膜成像的非视线成像技术.这些技术都有一个淳朴的初 ...

  2. ocdma相干非相干_相干成像和非相干成像有什么区别?

    区别主要包含以下几个方面成像原理 截止频率 传递函数 相位 分辨率 成像原理 顾名思义,相干成像就是用相干光照明,非相干成像就是用非相干光照明.而介于两者之间的部分相干光可以通过去耦合的方式等效为多种 ...

  3. 非视距成像:硬件设备总结

    (本文参考Maeda, T. et al. (2019) 'Recent advances in imaging around corners', arXiv preprint arXiv:1910. ...

  4. 论文阅读 激光脉冲主动非视距成像+深度学习 || Learned Feature Embeddings for Non-Line-of-Sight Imaging and Recognition

    论文原文: Wenzheng Chen, FangyinWei, Kiriakos N. Kutulakos, Szymon Rusinkiewicz, and Felix Heide. 2020. ...

  5. Computational Imaging 计算成像(一)

    Computational Imaging 计算成像 序言 The motivation for writing this primer book on Computational Imaging w ...

  6. 1.43千米外隔墙透视!这项黑科技已被中科大潘建伟团队实现 | PNAS

    点击上方"AI遇见机器学习",选择"星标"公众号 重磅干货,第一时间送达 梦晨 发自 凹非寺 量子位 报道 | 公众号 QbitAI 透视远处墙后面的物体,听起 ...

  7. 1.43千米外隔墙透视!这项黑科技已被中科大潘建伟团队实现

    透视远处墙后面的物体,听起来不是魔法就是超能力. 但已经被中科大潘建伟.窦贤康.徐飞虎带领的团队实现了,而且距离高达1.43千米.这项技术称为远距离非视域成像. 本次实验地点在上海,将成像系统放置在下 ...

  8. 斯坦福用普通相机和激光笔实现“穿墙透视”,连你的证件都能看清

    点击我爱计算机视觉标星,更快获取CVML新技术 本文来自新智元. 来源:venturebeat 编辑:大明 [新智元导读]能穿墙透视的"非视距成像"技术前几年就已火过一回了,最近斯 ...

  9. CVPR2019论文题目中文列表

    英文题目 中文题目   Finding Task-Relevant Features for Few-Shot Learning by Category Traversal 少镜头学习中用类别遍历法寻 ...

最新文章

  1. Linux环境下命令行截图【转】
  2. 【Blog.Core开源】框架集成部门权限
  3. java程序结构_java程序结构
  4. Python reduce 函数 - Python零基础入门教程
  5. 95-230-020-源码-WordCount走读-获取StreamGraph的过程
  6. Spring MVC 学习笔记 spring mvc Schema-based configuration
  7. 电脑系统及软件安装日期查看
  8. 项目管理常用文档表格模板一
  9. 《沙盘模拟系列》JVM如何调优
  10. playsound报错
  11. 用dnspod进行DNS解析出错的解决方案
  12. python socket
  13. 微信公众号数据2019_全国公众号总排名2019,全国微信公众号排名
  14. csr_matrix详细解读
  15. 技巧|微信个性签名,汽车手动挡效果,你喜欢这样的吗?
  16. Mysql8.0.28-winx64安装
  17. MLDonkey Web set
  18. 【微信开发者工具】at-rule or selector expectedcss(css-ruleorselectorexpected)
  19. 数据分析---------指数计算
  20. npf拒绝访问的问题

热门文章

  1. 位运算(异或、左移、右移)的运算规则
  2. xp下IIS500错误解决方案
  3. 类似360的轨迹加密功能
  4. led-led paths_LED时刻的重要性-我做到了
  5. 孤立波matlab,色散方程的两个八点差分格式
  6. nas网络存储服务器性能要求,NAS系统的优缺点全面介绍
  7. excel中VBA获取指定单元格内容
  8. 打车软件烧钱背后的商业逻辑
  9. 2020计算机数电实验第四次(2)
  10. 深度剖析Linux与Windows系统的区别