来源:科技智谷

编译:徐浩

75年前,宝丽来相机拍摄出第一张即时照片,是人类第一次以逼真的二维图像快速捕捉三维世界,具有划时代的意义。今天,人工智能的研究人员正在进行相反的工作,力求在几秒钟的时间内将静止图像的集合变成数字3D场景。

在本周的春季图形技术大会(GTC)上,Nvidia展示了一种新的逆渲染方法(Instant NeRF)——从少量2D图像中重建3D场景。逆向渲染使用AI来模拟现实世界里的光线,基于Nvidia Research团队开发的技术,让渲染过程极大地缩短,几乎可以说是立即发生。

事实上,在2D转3D的相关领域,Nvidia一直在尝试技术突破,致力于推出更强大的工具来完成这一过程。但即使是Nvidia这样的行业领先公司,即时渲染3D也是一项极为艰难的技术挑战。

这更凸显出Instant NeRF的来之不易。关于这一成就,谷歌科学家Jon Barron在推特上表示:18个月前,训练NeRF还需要5小时;2个月前,训练NeRF最快也需要5分钟;就在近日,基于英伟达的最新技术,训练NeRF最快也需要5秒!

01

Instant NeRF的技术原理

据了解,Nvidia能够取得这一成绩的主要原因是采用了一种被称作多分辨率哈希编码(Multiresolution Hash Encoding)的技术。在一篇论文《基于多分辨率哈希编码的即时神经图形基元》中,Nvidia对这一新技术做了详细说明。

Nvidia表示:“计算机图形基元基本上由有关外观的各项参数的数学函数表示。参数的数学计算结果对于视觉保真度至关重要。”言下之意是,Nvidia希望在保持速度和数学函数紧凑度的同时,还能捕获高频、局部的图形细节。

为了达到上述要求,Nvidia采用了多分辨率哈希编码技术。据Nvidia称,该技术有着自适应性和高效性两大特性。函数内部只有两个值需要进行配置,分别为参数的数量T和所需的最佳分辨率N max。

该方法映射了来自各个角度的2D镜头的颜色和光线强度,然后生成数据,再结合摄像机位置的相关数据,将这些来自不同位置的图像连接起来,从而渲染出3D场景。

利用该技术,只需经过几秒钟的训练,便能在各种任务中达到较高的质量。

在GTC会议上,Nvidia展示了一张图片,图片上是一个穿着像安迪·沃霍尔(Andy Warhol)的模特拿着一个老式的宝丽来相机。在参与者还没有反应过来的时候,Nvidia迅速把这张图片转换为了3D效果,引起了现场的阵阵惊叹。

展示之后,Nvidia的Isha Salian在现场表示:Instant NeRF(中文叫神经辐射场)是由加州大学伯克利分校、Google研究院和加州大学圣地亚哥分校的研究人员在2020年开始研发的一项技术。

该模型是使用Nvidia CUDA工具包库开发的。由于它是一个轻量级的神经网络,它可以在单个Nvidia GPU上进行训练和运行,在核心卡上运行最快。

几年来,研究人员一直在改进这种从2D到3D的技术,旨在为渲染出的成品增加更多画面细节,并提高渲染速度。Nvidia表示,新一代Instant NeRF模型是迄今为止最快的技术之一,将渲染时间从几分钟缩短到“几乎瞬间”就能完成。

02

NeRF的应用范围

Isha Salian进一步阐释说,这种方法可以应用于广泛的领域。它可用于为虚拟世界创建头像或场景,以3D形式捕获视频会议参与者及其环境,甚至重建3D数字地图的场景。

在上述领域,使用传统方法创建3D场景可能需要数小时或更长时间,具体取决于可视化的复杂性和分辨率。而NeRF使用神经网络系统,效率和准确度大幅度提升。

关于这一点,Nvidia图形研究副总裁David Luebke在一份声明中点出:“Instant NeRF对3D来说可能与数码相机对2D一样重要。因为在2D摄影中,JPEG压缩一直是关键的步骤,它大大提高了3D捕获和共享的速度、易用性和覆盖范围。”

“这项技术可用于训练机器人和自动驾驶汽车,通过捕捉现实世界物体的二维图像或视频片段来了解它们的大小和形状。它还可以用于建筑和娱乐业,通过快速生成真实环境的数字函数,创作者可以在此基础上进行修改和构建。”

业内人士表示,NeRF在自动驾驶、航空测量等领域也具有广泛应用前景。例如创建大范围的高保真地图,为机器人定位、导航等应用提供帮助。此外,自动驾驶系统通常需要重新模拟以前遇到的场景来进行安全评估,然而,如果历史记录中存在任何的偏差都可能改变车辆的真实轨迹,因此需要沿着路径进行高保真的视图渲染,这同样需要NeRF技术。在自动驾驶中,除了基本的视图合成,以场景为条件的NeRF还能够改变环境照明条件,例如相机曝光、天气或一天中不同的时间,从而进一步提升模拟驾驶场景的仿真度。

除了NeRF之外,Nvidia的研究人员还在探索如何利用这种输入编码技术来加速多种人工智能挑战,包括强化学习、语言翻译和通用的深度学习算法。

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)大脑研究计划,构建互联网(城市)大脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。每日推荐范围未来科技发展趋势的学习型文章。目前线上平台已收藏上千篇精华前沿科技文章和报告。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

2D图像转3D仅需5秒,特斯拉的自动驾驶技术有救了?相关推荐

  1. 用单张2D图像重构3D场景

    用单张2D图像重构3D场景 zouxy09@qq.com http://blog.csdn.net/zouxy09 之前看到Stanford大学的机器学习公开课程的lecture01中,Andrew ...

  2. 超级计算机算200p什么意思,超级计算机一万年的运算仅需200秒,量子霸权的神话真的能实现吗?...

    原标题:超级计算机一万年的运算仅需200秒,量子霸权的神话真的能实现吗? 近日,一篇刊登在NASA官网的重量级文章引起全球热议.谷歌的科研人员利用一台53量子比特的量子计算机成功执行了一项计算任务,2 ...

  3. CV之FR:基于DIY人脸图像数据集(每人仅需几张人脸图片训练)利用Hog方法提取特征和改进的kNN算法实现人脸识别并标注姓名(标注文本标签)—(准确度高达100%)

    CV之FR:基于DIY人脸图像数据集(每人仅需几张人脸图片训练)利用Hog方法提取特征和改进的kNN算法实现人脸识别并标注姓名(标注文本标签)-(准确度高达100%) 目录 基于DIY人脸图像数据集( ...

  4. Python 刷英语六级段落匹配仅需 3 秒?

    作者 | 叶庭云 来源 | AI庭云君 一.前言 一年二度的四六级考试就此落下帷幕,本次考试体验感极强,反手就是一个 "五星好评" 本文利用 Python 的模糊匹配方法来刷英语六 ...

  5. 亿条数据读取工具_仅需1秒!搞定100万行数据:超强Python数据分析利器

    作者:Maarten.Roman.Jovan 编译:1+1=6 1.前言 使用Python进行大数据分析变得越来越流行.这一切都要从NumPy开始,它也是今天我们在推文介绍工具背后支持的模块之一. 2 ...

  6. 仅需1秒!搞定100万行数据:超强Python数据分析利器

    前言 使用Python进行大数据分析变得越来越流行.这一切都要从NumPy开始,它也是今天我们在推文介绍工具背后支持的模块之一. 2 Vaex 很多人学习python,不知道从何学起. 很多人学习py ...

  7. python秒转换成小时分钟秒_仅需1秒!搞定100万行数据:超强Python数据分析利器...

    文章来源:量化投资与机器学习 作者:Maarten.Roman.Jovan 编译:1+1=6 1 前言 使用Python进行大数据分析变得越来越流行.这一切都要从NumPy开始,它也是今天我们在推文介 ...

  8. 处理100万条数据 python_仅需1秒!搞定100万行数据:超强Python数据分析利器

    作者:Maarten.Roman.Jovan 编译:1+1=6 1.前言 使用Python进行大数据分析变得越来越流行.这一切都要从NumPy开始,它也是今天我们在推文介绍工具背后支持的模块之一. 2 ...

  9. python数据分析要求高性能计算机_仅需1秒!搞定100万行数据:超强Python数据分析利器...

    作者:Maarten.Roman.Jovan 编译:1+1=6 1.前言 使用Python进行大数据分析变得越来越流行.这一切都要从NumPy开始,它也是今天我们在推文介绍工具背后支持的模块之一. 2 ...

最新文章

  1. java 课程设计 计算器_JAVA课程设计-计算器(201521123028 李家俊)
  2. OpenCV源码中Haar训练及特征提取的代码说明
  3. Hibernate与 MyBatis的比较
  4. 14.3 线程实现方法2
  5. xss攻击汇总--转
  6. 10代cpu装win7_11代CPU共26款型号全曝光:10核心确定没了
  7. Python和Java就业前景对比
  8. 中石油训练赛 - Swapity Swap(矩阵快速幂)
  9. Linux 下安装与卸载JDK
  10. 【解决】如何打开.ipynb文件
  11. 用函数计算搭建页面的前端CICD系统,提升访问体验
  12. Python地图可视化利器folium学习实践
  13. 一个asp.net聊天是源码
  14. mysql必知必会样例表_《SQL必知必会》笔记1-样例表说明及建表语句
  15. 无法保存此文档。它可能是只读的,或者正在被其他应用程序使用
  16. STP生成树协议基础
  17. Docker 容器的随机命名
  18. 小学期c语言电脑的总结,小学期实践报告和总结
  19. ASO|如何开展工作
  20. 台式计算机截图快捷键,电脑截屏的快捷键是什么

热门文章

  1. 带您走进松本行弘的程序世界
  2. Tensorflow-gpu1.13.1 和 Tensorflow-gpu2.0.0共存之安装教程
  3. Tensorflow 可视化 TensorBoard 尝试~
  4. 炸裂!VSCode 摸鱼神器!!!
  5. 报名 | 二值化网络 基于素描图的图像检索论坛
  6. 剑指offer:平衡二叉树
  7. 33篇顶会论文如何做到?北大施柏鑫:论文投稿到接收,不可不知的关键环节...
  8. 【一周论文速递】自然语言处理最新论文!
  9. AI隐形衣:穿上这件连帽衫,监控算法对你“视而不见”
  10. 「完结」你对深度学习模型的理解是否足够深刻,这12篇文章了解下