点击上方“3D视觉工坊”,选择“星标”

干货第一时间送达

光是人类对物理世界进行观测与感知最重要的载体之一,人类通过人眼接收场景中物体发出的光线(主动或被动发光)进行感知。成像感知系统是人眼的延伸,捕获、记录、分析场景的光信息。然而,现有的成像感知系统大多仅支持二维成像,迫使我们只能通过二维窗口去观察三维世界,从而丢失了三维世界的丰富信息。

当前内容创建方法

开发人员使用三种主要方法来创建移动或VR / AR / MR应用程序。每种内容方法通常基于其最终的显示设备或特定的应用程序要求,具有独特的优势。

3D模型–用多边形制作对象的表示形式。

摄影测量法–拍摄物体的许多照片,并使用软件生成此信息的3D模型。

视频–拍摄对象。

如果我们要构建“第一人称射击”游戏,则可能会将整个游戏创建为复杂的3D模型。如果我们想对现实世界进行超现实的表现,可以选择使用摄影测量法。如果我们正在制作360度纪录片,可能会使用视频。许多应用程序将这些技术无缝结合在一起以发挥其独特优势。

什么是光场?

使用Lytro的Immerge相机(2018)产生的光场示例

光场是三维世界中光线集合的完备表示,采集并显示光场就能在视觉上重现真实世界。

在人类的五大感知途径中,视觉占据了70%~80%的信息来源。借助视觉,我们能准确抓取杯子,能在行走中快速躲避障碍物,能自如地驾驶汽车,能完成复杂的装配工作。从日常行为到复杂操作都高度依赖于我们的视觉感知。然而,现有的图像采集和显示丢失了多个维度的视觉信息。这迫使我们只能通过二维“窗口”去观察三维世界。例如医生借助单摄像头内窥镜进行腹腔手术时,因无法判断肿瘤的深度位置,从而需要从多个角度多次观察才能缓慢地下刀切割。从光场成像的角度可以解释为:因为缺乏双目视差,只能依靠移动视差来产生立体视觉。再例如远程机械操作人员通过观看监视器平面图像进行机械遥控操作时,操作的准确性和效率都远远低于现场操作。

可以将光场想像成通向另一个世界的神奇窗口。

该窗口使用户可以从任何角度查看内部,并查看另一侧的内容更改。用户可以像现实生活中那样靠近窗口或移动到一侧,并看到不同的信息。如果用户非常靠近窗户,他们可以完全沉浸在这个其他现实中。当它们到达窗口边缘时,将看不到其他内容。光场的创建者可以根据其特定用途来决定该窗口的大小。

光场体积可创建从定义空间内每个可见位置拍摄的图像。当你的头部移动时,会实时交换正确的图像。如果你使用的是VR,例如上面的示例,那么每只眼睛都会交换单独的图像,以营造深度感。

为什么光场很重要?

早在1908年,加布里埃尔·利普曼(Gabriel Lippman)因他的“Photographie intégrale”(也被称为积分成像)获得了诺贝尔奖。这个发明是由许多微小的透镜组成的透镜的构想。这允许每个镜头捕捉略有不同的视图。Lippman的原始理论(现在称为虫眼透镜或微透镜阵列)只有12个透镜。

尽管获得了诺贝尔奖,李普曼实际上从未造过一台能正常工作的照相机!虽然他的想法是革命性的,但几十年来,这项技术仍然是一个不可思议的边缘概念。在同一时间,以高质量的方式捕捉如此多的图像,超出了早期摄影的新兴技术。最接近的商业用途是立体镜,它虽然非常流行,但只显示固定的立体图像。

Marc Levoy和Pat Hanrahan于1996年发表的SIGGRAPH论文“光场渲染”中的视频

在1990年代,探索光场得到了重生。个人计算机的兴起和实用计算机图形的创建使第一批真正的捕捉得以实现。像SIGGRAPH这样的创新中心让这些曾经的小众想法有了一个论坛。就像几十年前一样,这项技术在当时处于领先地位。

光场的好处是什么?

这种内容创建方法具有视频的优点,因为它是被捕获的内容的100%表示,是高分辨率的,是即时捕获,加上我们可以在立体声中看到,并可以在这个内容内移动,到一个预定义的程度。

斯坦福大学(Stanford)的多相机阵列示例(2002年)

OTOY(2015)通过自动相机捕获光场的示例

真实世界的内容可以通过微镜头阵列捕捉,即一个巨大的相机与一堆镜头。如上图所示,甚至单个或多个镜头也可以在空间中快速操作。

Frooxius(2015)通过Blender渲染的CGI示例,使用光场显示

或内容可以是计算机图形(CGI)。尽管这些可以渲染为3D对象,但是现代设备的计算能力受到限制。光场允许模型,纹理,照明和反射的最高保真度,这是实时无法实现的。

Joan Charmant(2016)使用Oculus Rift Dev Kit 2在VR中进行光场渲染的示例

重要的是要注意,光场实际上是在空间中漂浮的图像,它将正确的图像交换为用户的特定位置。这意味着,如果我们可以快速交换正确的图像,那么几乎无需花费CPU或GPU即可产生非常复杂的视觉效果。这些光场捕获技术上也是全息的。这意味着它们满足定义的预设范围内的所有可能的视图。

王挺春,朱俊彦,尼玛·哈迪米·卡兰塔里,阿列克谢·埃弗罗斯和拉维·拉莫莫蒂(2017)的``使用基于学习的混合成像系统进行光场视频捕获''中的光场视差示例

光场捕获有视差,一种基于头部运动的物体深度重叠。这增加了沉浸感和存在感,而这在360度视频中是无法实现的。我们也能在光场之间动画或捕捉光场序列,就像电影一样。

迪士尼研究院(Disney Research)的“带有压缩动画光场的实时渲染”中的动画光场的示例。由Charalampos Koniaris,Maggie Kosek,David Sinclair和Kenny Mitchell撰写(2017)

    王挺春,朱俊彦,尼玛·哈迪米·卡兰塔里,阿列克谢·埃弗罗斯和拉维·拉莫莫蒂(2017)的``使用基于学习的混合成像系统进行光场视频捕获''中调整相机焦点的示例

相对于拍摄时需要聚焦的视频,也可以根据深度动态调整光场的聚焦或光圈。这是因为光场可以基于所获取的数据来估计深度。

南加州大学创意技术学院混合现实研究主任兼南加州大学电影艺术学院副教授马克·波拉斯(Mark Bolas)举例说明了光场相互作用(2016年)

就像3D模型一样,可以将多个光场捕获合并在一起并进行操作。这种交互性是对静态视频的又一重大改进。完全控制大小,位置,更换光源或完全替换光场捕获,对于创造者而言,可能性是无限的。或者可以将光场与3D模型,胶片或摄影测量法混合使用,以增加对现实的错觉。

图片来自Marc Levoy和Pat Hanrahan的经典SIGGRAPH 1996年论文

但是光场还有另一个优势,那就是细微变化之间的大多数数据不是唯一的。因此,大多数数据都是不需要的,可以删除。通过删除此多余的视觉信息,可以压缩1000张高质量的小动作照片,并将其压缩到此大小的一小部分。

什么是摩尔定律?为什么现在有光场相关?

Fairchild Semiconductor和Intel的创始人Gordon Moore提出,在未来十年中,电路芯片上晶体管的数量每年将增加一倍。50多年后的今天,“摩尔定律”仍然保持着强大的地位,使我们的个人计算机中的魔力以指数级的速度增长。

但是,摩尔定律不仅涉及计算机的功能。其他计算机组件也取得了相同的指数增长。在过去的十年中,我们注意到图形芯片变得越来越小。电池变得更小,使用寿命更长。一切都变得更轻松了。这些中的每一项都使诸如手机,平板电脑和无线VR / AR设备之类的新发明成为可能。

RAM是您的计算机保存可供访问的信息的能力,RAM开始允许我们在移动设备上实现新的技术比如光场。

光场技术的应用展望

从全世界光场技术的发展趋势来看,美国硅谷的科技巨头如谷歌、Facebook、Magic Leap等争相布局和储备光场技术,有些甚至已经出现了Demo应用。目前光场技术在照明工程、光场渲染、重光照、重聚焦摄像、合成孔径成像、3D显示、安防监控等场合有着广泛的应用。

对光场技术的研究主要分为两大方面,包括 光场采集和 光场显示。

光场采集技术相对更成熟,目前在某些To B领域已经基本达到可以落地使用的程度。光场采集主要是提供3D数字内容,对于光场采集系统的硬件成本、体积、功耗有更大的可接受度。相关应用如吃到第一只螃蟹的Lytro光场相机,在工业领域的应用一直稳步上升。

相比之下,光场显示是偏向To C的产品,个体用户在成本、体积、功耗、舒适度等多方面都极度挑剔。光场显示除了能产生传统的2D显示器的所有信息外,还能提供双目视差、移动视差、聚焦模糊三方面的生理视觉信息。在光场显示技术发展过程中,出现了多种光场显示技术,最常见的有:多层液晶张量显示、数字显示、全息显示、集成成像光场显示、多视投影阵列光场显示、体三维显示。目前,光场显示正在通往商业化实用的道路上,最大的挑战在于光场显示设备的小型化和低功耗,这需要材料学、光学、半导体等多个基础学科的共同努力。

本文仅做学术分享,如有侵权,请联系删文。

下载1

在「3D视觉工坊」公众号后台回复:3D视觉即可下载 3D视觉相关资料干货,涉及相机标定、三维重建、立体视觉、SLAM、深度学习、点云后处理、多视图几何等方向。

下载2

在「3D视觉工坊」公众号后台回复:3D视觉github资源汇总即可下载包括结构光、标定源码、缺陷检测源码、深度估计与深度补全源码、点云处理相关源码、立体匹配源码、单目、双目3D检测、基于点云的3D检测、6D姿态估计源码汇总等。

下载3

在「3D视觉工坊」公众号后台回复:相机标定即可下载独家相机标定学习课件与视频网址;后台回复:立体匹配即可下载独家立体匹配学习课件与视频网址。

重磅!3DCVer-学术论文写作投稿 交流群已成立

扫码添加小助手微信,可申请加入3D视觉工坊-学术论文写作与投稿 微信交流群,旨在交流顶会、顶刊、SCI、EI等写作与投稿事宜。

同时也可申请加入我们的细分方向交流群,目前主要有3D视觉CV&深度学习SLAM三维重建点云后处理自动驾驶、多传感器融合、CV入门、三维测量、VR/AR、3D人脸识别、医疗影像、缺陷检测、行人重识别、目标跟踪、视觉产品落地、视觉竞赛、车牌识别、硬件选型、学术交流、求职交流、ORB-SLAM系列源码交流、深度估计等微信群。

一定要备注:研究方向+学校/公司+昵称,例如:”3D视觉 + 上海交大 + 静静“。请按照格式备注,可快速被通过且邀请进群。原创投稿也请联系。

▲长按加微信群或投稿

▲长按关注公众号

3D视觉从入门到精通知识星球:针对3D视觉领域的视频课程(三维重建系列、三维点云系列、结构光系列、手眼标定、相机标定、orb-slam3等视频课程)、知识点汇总、入门进阶学习路线、最新paper分享、疑问解答五个方面进行深耕,更有各类大厂的算法工程人员进行技术指导。与此同时,星球将联合知名企业发布3D视觉相关算法开发岗位以及项目对接信息,打造成集技术与就业为一体的铁杆粉丝聚集区,近2000星球成员为创造更好的AI世界共同进步,知识星球入口:

学习3D视觉核心技术,扫描查看介绍,3天内无条件退款

圈里有高质量教程资料、可答疑解惑、助你高效解决问题

觉得有用,麻烦给个赞和在看~  

光场技术的过去,现在和未来相关推荐

  1. 他是阿里中台之父,从一线员工做到CTO:有商业意识的技术人,才有未来!

    他是第一任阿里中台事业部总裁,全面负责"大中台,小前台"的战略落地工作.疫情期间带领团队3天开发出"健康码",历任阿里巴巴集团CTO.达摩院院长.阿里云智能总裁 ...

  2. 《埃森哲技术展望2016》解密未来企业竞争究竟拼什么?

    近几年来,崇尚先进技术,强调技术决定一切的理论淹没了很多声音.企业在忙于上马新技术的同时,忽视了一系列应与之配套的重要因素:企业文化和人才培养仍然落后.导致先进技术无法发挥最大作用,无法实现企业最优绩 ...

  3. 我对前端技术更新的看法以及未来发展趋势预测

    我对前端技术更新的看法以及未来发展趋势预测 前端开发如何看待"别更新了,学不动了"?Deno.TypeScript 等新轮子层出不穷,未来前端重点方向在哪?前端开发在大前端浪潮下如 ...

  4. 李彦宏纳猛将,技术才是百度的未来

    5月17日,百度公司正式成立百度硅谷实验室,并宣布任命前谷歌大脑(Google Brain)项目负责人吴恩达为百度首席科学家,全面负责百度研究院. 百度研究院 百度深度学习研究院(IDL) 成立于20 ...

  5. 【白皮书分享】技术重构社会供应链:未来科技趋势白皮书.pdf(附下载链接)...

    今天给大家分享京东于2021年1月发布的白皮书<技术重构社会供应链:未来科技趋势白皮书.pdf>,关注科技及技术的伙伴们别错过了呀! 本白皮书选取了人工智能.物联网.区块链.自主系统.下一 ...

  6. RFID技术为智能轮胎在未来车联网领域的应用奠定了基础

    4月7日小编向大家公布了工信部7月1日将要实施的关于轮胎用射频识别(RFID)电子标签的4项行业标准,今天向大家分享关于轮胎RFID技术的推广之路. RFID技术的发展,使轮胎拥有"身份证& ...

  7. 技术人该如何选择未来职业方向?一起听听这几位美团同学的故事

    2021年还有不到两个月结束,如果你回头去看过去的这两年,不难发现中国科技互联网的潮流走向发生了巨变,用数字化技术改造物理世界.助力实体经济,已经成为一种格外重要的能力. 越是潮水方向改变时,选择越是 ...

  8. 计算机科学与运用 未来,计算机科学与技术的应用现状与未来趋势分析

    计算机科学与技术的应用现状与未来趋势分析 摘 要:电子计算机应用技术早在上个世纪的五十年代便开始得到发展,而且随着对这方面研究的越来越深入,人们在信息技术方面所提出的要求也越来越高.直至今天,不同类型 ...

  9. 陆教授浅谈:5G毫米波手机天线技术的发展现状和未来的应用场景

    近日,香港城大电子工程学系讲座教授陆贵文教授荣获英国皇家工程院院士荣衔,以表彰他在推动天线研究的卓越贡献.他研发的天线由L形探针馈电微带天线.磁电耦极天线,以至5G毫米波手机天线等技术,均在天线领域影 ...

最新文章

  1. 深入浅出的“深拷贝与浅拷贝”
  2. 语音识别可以直接编码吗
  3. 隧道接口工具airtun-ng
  4. linux中sh基本语法
  5. Mysql之case when用法总结
  6. UITableView中selectRowAtIndexPath: animated:scrollPosition滚动到指定Row
  7. Linux/windows下nginx的安装及使用
  8. 人际交往的“三有三避”
  9. 文件共享服务器地址格式,文件共享服务器配置
  10. php简单的登录界面,PHP实现简单用户登录界面
  11. 吴恩达机器学习 12.异常检测
  12. 点钞机语音怎么打开_这才是华为手机语音助手正确打开方式,远比你想象的要强大很多!...
  13. 适合初学者的大数据学习路线
  14. 小麦(Wheat)-玉米(Maize)-水稻(Rice) 数粒软件
  15. 【React入门实践】结合Ant-Design从0带你手把手开发【个人中心-信息修改】页面
  16. 神舟战神笔记本安装Ubuntu16.04 系统
  17. GraphQL(四):GraphQL工程化实践
  18. 【oracle工具】plsqldev美化规则文件详细解释(关键字大写,标识符小写等规则)
  19. R语言检验多重共线性 vif
  20. 浙江省计算机二级题库excel,浙江省计算机二级excel题目

热门文章

  1. 溢折价摊销的实际利率法
  2. python科学计算和可视化编程
  3. 【概率论】几种常见的概率分布表
  4. Java——【习题】java泛型练习题
  5. python上传文件到web
  6. java毕业设计旧物置换网站mybatis+源码+调试部署+系统+数据库+lw
  7. ffmpeg 打开USB摄像头
  8. SAP MM批次管理(4)批次分类
  9. 串口开发 打印机 读卡器 遇到的问题
  10. 最新UI界面很简洁的方盒子iApp源码+适合做工具箱