非视线成像 - 把墙角变为相机
点击上方“3D视觉工坊”,选择“星标”
干货第一时间送达
我已经为你介绍了基于飞秒摄影、基于WIFI、以及基于角膜成像的非视线成像技术。这些技术都有一个淳朴的初衷,希望能够在视线成像无法触达的时候,能够观察到隐藏的场景,从而可以帮助行车安全、反恐防暴、消防救灾等等。
然而,不管是飞秒摄影,还是WIFI,都需要有专门的设备来发射信号,这些设备要么在特定场景容易收到干扰,要么就是特别昂贵。而角膜成像也仅仅在特殊情况下有用。那么,有没有一种可能,能够完全不用主动发射任何信号,通过被动观察可见场景,就能推断出隐藏场景的情况呢?
今天我就来介绍一种仅仅通过摄像机观察到的微弱图像变化,就能推断出隐藏场景中有没有人,有几个人,这些人大概有多远的技术——这就是所谓的“墙角相机”
【本文同步发表在我的微信公众号和知乎专栏“计算摄影学”,欢迎扫码关注,转载请注明作者和来源】
我们照例,先来看看美女视频,有请模特Sunny妹出场:
这个技术来自MIT,论文如下:
这里的领衔作者Katherine也是个大美女:
也许你现在还不知道她是谁,但如果告诉你,正是她带领的团队拍摄了第一张“黑洞”的照片,你就一定会哇哦了!
好了,不谈美女了(Doge),我们来看看墙角相机技术背后的原理吧:
一. 基本原理
1.1 墙角相机的四大组成部分
让我们先来看看墙角相机有哪些组成部分。下图是整个墙角相机的示意图,我们看到了几个重要的组成部分:
相机
有倒角的墙面
相机能观察到的区域(对我们来说最重要的是红色扇形区域)
被墙挡住的隐藏场景
我们的目的就是要通过分析相机观察到的红色区域的信息,得出关于隐藏场景的重要信息,例如隐藏场景有没有人,有几个人,距离拐角有多远,等等。我想你已经通过文章一开始的视频展示中看到了墙角相机的威力。
作者在视频中展示了一个墙角相机系统,这里一个单反对着前方的地面
拐角另外一边是一个走廊,有光线从走廊外照射进来。我们可以观察到地面上的光线有轻微的渐变现象,这是因为墙角挡住了另外一个方向的光,但地面又是漫反射表面导致的。
当有人在被遮挡住的走廊上走动时,地面的光影会发生轻微的改变,作者就是想通过这种改变来对隐藏区域加以分析。
1.2 观测区域与光线的微小变化引起的图像变化
接着我们看看下面这个示意图,假设你站在下图中的p点四处张望,你将可以看到下图中浅棕色的部分,但无法直接观察到灰色的部分。此时射线op与墙面的夹角为theta度
如果你沿着p点所在的圆弧继续行走到达p1点,你将可以观察到更多的区域,如下图所示:
这说明什么呢?说明p点、p1点其实接受到了来自于被墙面遮挡住的一部分区域的信息!如果我们用一个相机观察p点和p1点的地面,是可以收获到一点点墙后的信息的。进一步讲,如果能够整合下图中红色扇形区域的地面反射信息,就能够获得被墙挡住的区域的信息——这真是个精妙的想法!
作者们的论文题图中也展示了这个思想,其中(a)图展示摄像头观察地面。在(b)图中,假设有一个第三方观察者沿着一个圆弧绕着墙角移动,就能随着移动观察到墙后面不同范围的场景。而(c)图则是摄像头观察到的扇形区域。当墙后面有人在运动时,对光线造成了遮挡,导致摄像头看到的画面会出现肉眼难以察觉的微小变化(图c),图(d)通过对图像内容增强展示了这种变化,而图e则是通过本文的方法重建出来的1D信号——它说明墙后有两个人在走动,且她们不断在改变相对墙面的角度。
我们可以通过下面的视频加深认知:
1.3 表达与求解隐藏区域信息
首先来看看作者论文中的定义:
1.4 作者的更多示例展示:
诚如你看到的,我们得到的x的各个元素描述了被墙遮挡的区域每个不同的角度的信号,这也是你从视频一开始看到的曲线图中能得到的信息。我们可以看看作者更多示例:
比较有趣的是,通过上述视频你可以看到,当只有1个人在隐藏区域走动时,我们看到了单条曲线。而如果有两个人走动时,我们会看到两条交织在一起的曲线。这里曲线纵向是时间轴,而横向则表示被人挡住的光线的入射角度。曲线的波形和视频中两位姑娘的走动方式也是吻合的。
在视频中,你可以看到不管是室内,还是室外,还是不同的天气情况下,作者得到的结果都挺不错的。不管我自己复现过程中发现,光照、地面材质、选取的拍摄设备、超参数的设置等的影响还是挺大的。像我开头展示的视频,就是反复选择了好几处拍摄地点后才挑选出来的。
二. 扩展:立体墙角相机
比较有趣的是,作者说一对墙角相机还能组合到一起,形成立体墙角相机
这里不同的地面阴影区域反映了不同的隐藏区域的信息。
如果将这些信息组合起来,就可以获取到隐藏区域人物的位置了
通过下面这个视频,你可以理解的更深入:
三. 总结
今天我为你介绍了一种非常有趣的非视线成像方案:墙角相机。这种方法不仅仅有趣,更关键是它是完全被动式的,不需要像WIFI、TOF这样的额外信号源,这就使得它在某些情况下非常有用。我没有去查询当前这个技术的进一步研究和应用,但我非常认可作者的观点:这个技术为汽车行人安全、搜救和公共安全开辟了潜在的应用领域。
虽然理论比较复杂,但实际计算过程却比较简单。作者还开源了自己的实现,你可以下载后自己测试自己拍摄的墙角视频,正如我所做的一样。再次感谢Katherine和她的研究团队!
再次感谢模特Sunny出镜!
四. 参考资料
CMU 2017 Fall Computational Photography Course 15-463, Lecture 26
墙角相机项目官网:people.csail.mit.edu/kl 我引用了其中的:
论文
论文插图
使用其中代码验证了自己拍摄的视频
前面的几篇NLOS文章:基于飞秒摄影、基于WIFI、以及基于角膜成像的非视线成像技术
Katherine L. Bouman的照片来自于:actitudfem.com/tecnolog
本文仅做学术分享,如有侵权,请联系删文。
3D视觉精品课程推荐:
1.面向自动驾驶领域的多传感器数据融合技术
2.面向自动驾驶领域的3D点云目标检测全栈学习路线!(单模态+多模态/数据+代码)
3.彻底搞透视觉三维重建:原理剖析、代码讲解、及优化改进
4.国内首个面向工业级实战的点云处理课程
5.激光-视觉-IMU-GPS融合SLAM算法梳理和代码讲解
6.彻底搞懂视觉-惯性SLAM:基于VINS-Fusion正式开课啦
7.彻底搞懂基于LOAM框架的3D激光SLAM: 源码剖析到算法优化
8.彻底剖析室内、室外激光SLAM关键算法原理、代码和实战(cartographer+LOAM +LIO-SAM)
9.从零搭建一套结构光3D重建系统[理论+源码+实践]
10.单目深度估计方法:算法梳理与代码实现
11.自动驾驶中的深度学习模型部署实战
12.相机模型与标定(单目+双目+鱼眼)
13.重磅!四旋翼飞行器:算法与实战
14.ROS2从入门到精通:理论与实战
重磅!3DCVer-学术论文写作投稿 交流群已成立
扫码添加小助手微信,可申请加入3D视觉工坊-学术论文写作与投稿 微信交流群,旨在交流顶会、顶刊、SCI、EI等写作与投稿事宜。
同时也可申请加入我们的细分方向交流群,目前主要有3D视觉、CV&深度学习、SLAM、三维重建、点云后处理、自动驾驶、多传感器融合、CV入门、三维测量、VR/AR、3D人脸识别、医疗影像、缺陷检测、行人重识别、目标跟踪、视觉产品落地、视觉竞赛、车牌识别、硬件选型、学术交流、求职交流、ORB-SLAM系列源码交流、深度估计等微信群。
一定要备注:研究方向+学校/公司+昵称,例如:”3D视觉 + 上海交大 + 静静“。请按照格式备注,可快速被通过且邀请进群。原创投稿也请联系。
▲长按加微信群或投稿
▲长按关注公众号
3D视觉从入门到精通知识星球:针对3D视觉领域的视频课程(三维重建系列、三维点云系列、结构光系列、手眼标定、相机标定、激光/视觉SLAM、自动驾驶等)、知识点汇总、入门进阶学习路线、最新paper分享、疑问解答五个方面进行深耕,更有各类大厂的算法工程人员进行技术指导。与此同时,星球将联合知名企业发布3D视觉相关算法开发岗位以及项目对接信息,打造成集技术与就业为一体的铁杆粉丝聚集区,近4000星球成员为创造更好的AI世界共同进步,知识星球入口:
学习3D视觉核心技术,扫描查看介绍,3天内无条件退款
圈里有高质量教程资料、可答疑解惑、助你高效解决问题
觉得有用,麻烦给个赞和在看~
非视线成像 - 把墙角变为相机相关推荐
- 非视线成像:角膜成像系统
点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 作者丨HawkWang 来源丨计算摄影学 今天我将介绍一种很震撼的技术:角膜成像系统. 让我们先看看美 ...
- ocdma相干非相干_相干成像和非相干成像有什么区别?
区别主要包含以下几个方面成像原理 截止频率 传递函数 相位 分辨率 成像原理 顾名思义,相干成像就是用相干光照明,非相干成像就是用非相干光照明.而介于两者之间的部分相干光可以通过去耦合的方式等效为多种 ...
- 非视距成像:硬件设备总结
(本文参考Maeda, T. et al. (2019) 'Recent advances in imaging around corners', arXiv preprint arXiv:1910. ...
- 高光谱成像的传感器和相机要求
来源丨新机器视觉 通过适当的组件选择,高光谱成像技术可提供可见光范围以外的有效图像捕获. 高光谱成像(HSI)技术最初用于地球观测,已扩展到各个领域,从工业分类到医学研究,例如科学家利用该技术生成皮肤 ...
- 论文阅读 激光脉冲主动非视距成像+深度学习 || Learned Feature Embeddings for Non-Line-of-Sight Imaging and Recognition
论文原文: Wenzheng Chen, FangyinWei, Kiriakos N. Kutulakos, Szymon Rusinkiewicz, and Felix Heide. 2020. ...
- android 预览和拍照成像方向不一致,Android相机预览方向深入探究
原标题:Android相机预览方向深入探究 今日快讯 9月7日,北京市交通委召集各区管理部门和15家共享自行车企业负责人,听取共享自行车投放和管理的意见建议,研究决定并下发通知,暂停在本市新增投放共享 ...
- Computational Imaging 计算成像(一)
Computational Imaging 计算成像 序言 The motivation for writing this primer book on Computational Imaging w ...
- 斯坦福用普通相机和激光笔实现“穿墙透视”,连你的证件都能看清
点击我爱计算机视觉标星,更快获取CVML新技术 本文来自新智元. 来源:venturebeat 编辑:大明 [新智元导读]能穿墙透视的"非视距成像"技术前几年就已火过一回了,最近斯 ...
- CVPR2019论文题目中文列表
英文题目 中文题目 Finding Task-Relevant Features for Few-Shot Learning by Category Traversal 少镜头学习中用类别遍历法寻 ...
最新文章
- java频繁的new对象 优化方案
- vue保存内容到本地_Vue两个版本区别
- 数组中两个数的最大异或值 两数异或值一定小于两数相加和
- 静态链接中的那点事儿(1)
- android 地图放大缩小按钮,Android 百度最新地图隐藏 放大缩小按钮、指南针、缩放比例的方法...
- opencv 编译安装时出现报错 modules/videoio/src/cap_ffmpeg_impl.hpp:585:34: error: ‘AVStream {aka struct AVStre
- SaaS市场没有免费午餐!未来只有两种企业可生存
- CentOS minimal 版安装图形界面的步骤分享,中文语言包
- mySQL中replace的用法
- 数值分析(计算方法)
- C语言之父丹尼斯·里奇:乔布斯脚下的巨人肩膀
- 浏览器被7654和2345网页劫持解决办法
- 5855. 找出数组中的第 K 大整数
- CC1310开发笔记
- 剖析Unreal Engine超真实人类的渲染技术Part 1 - 概述和皮肤渲染
- 848. Shifting Letters**
- EtherCAT主站SOEM函数详解---- ecx_readstate、ecx_writestate
- Python中: unsupported format character ''' (0x27)
- TeamViewer远程控制华为设备方法
- 电脑和手机如何将PPT转成PDF?