点上方计算机视觉联盟获取更多干货

仅作学术分享,不代表本公众号立场,侵权联系删除

转载于:机器之心

AI博士笔记系列推荐

周志华《机器学习》手推笔记正式开源!可打印版本附pdf下载链接

神经辐射场(Neural Radiance Fields, NeRF)领域的最新研究展示了神经网络编码复杂 3D 环境的方式,这类方法能以新的视角真实地渲染环境。渲染这些图像需要非常大的计算量,即使在高端硬件上,这些新进展与实现交互式速率仍然相去甚远。

在本文中,来自微软的研究者提出了一种名为 FastNeRF 的新系统,它以每秒数百帧的速度渲染对象的高分辨率真实性新视图。相比之下,NeRF 等现有方法在速度上要慢几个数量级,并且只能以交互速率渲染分辨率很低的图像。

FastNeRF 的提出受到了移动和混合现实设备上场景的启发,并且是第一个基于 NeRF、能够在高端消费级 GPU 上以 200Hz 渲染高真实感图像的系统(如上图右)。该方法的核心思想是图启发的分解,它允许:在空间中的每个位置紧凑地缓存一个深度辐射图;使用光线方向有效地查询该图以估计渲染图像中的像素值。

大量的实验表明,在运行速度上,FastNeRF 是原始 NeRF 算法的 3000 倍,比加速版 NeRF 至少快一个数量级,同时又保持了视觉质量和可扩展性。

在 Realistic 360 Synthetic 数据集中 Lego 场景图上,新方法与其他方法的速度评估对比结果。

论文地址:

https://arxiv.org/abs/2103.10380

技术细节

架构

FastNeRF 在速度上取得了巨大的突破。这让在高端消费级硬件上以 200Hz 以上渲染高分辨率逼真图像。

该方法的核心包括将 NeRF 分解为两个神经网络:一个是生成深度辐射图的位置依赖网络;另一个是生成权重的方向依赖网络。权重的内积和深度辐射图用于预估场景中特定位置从特定方向观察所呈现的颜色。FastNeRF 架构可以被高效缓存,在保持 NeRF 的视觉质量的同时,显著提升了测试时间效率。

下图 2 展示了 NeRF 和 FastNeRF 网络架构的比较:

图 2:左:NeRF 神经网络架构。(x, y, z)代表输入样例位置,(θ, φ)代表光线方向,(r, g, b, σ)是输出颜色和透明度值。右:FastNeRF 架构将同一任务分为两个适合缓存的神经网络。位置依赖网络 F_pos 输出一张深度辐射图(u, v, w),其中包含 D 个分量。而 F_dir 在输入光线方向时,输出分量的权重(β_1, . . . , β_D)。

实现

训练 FastNeRF 和训练 NeRF 一样。研究者分别使用 8 层和 4 层的 MLP 建模 FastNeRF 的 F_pos 和 F_view,并将位置编码用于输入。

在测试阶段,FastNeRF 和 NeRF 都将一组相机参数作为输入。这些参数用于为输出中的每个像素生成光线,然后沿着每条光线生成大量样本并进行集成。FastNeRF 能够使用其神经网络表征来执行,当进行缓存时,性能会大幅度提升。

实验结果

该研究在 NeRF 论文中使用的 Realistic 360 Synthetic 和 Local Light Field Fusion(LLFF)数据集上进行了定量和定性评估。NeRF 合成数据集由复杂对象的 360 度视图组成,而 LLFF 数据集由前向场景组成,图像较少。在所有与 NeRF 的比较中,该研究均使用与 NeRF 论文中相同的训练参数。

下面来看一下实验结果。如下图 4 所示,FastNeRF 与 NeRF 在使用 8 个分量的 800^2 像素的 [25] 数据集上的定性比较。小型缓存是指我们的方法缓存在 2563,而大型缓存是在 7683。更改缓存大小可实现计算和内存 trading,以达到类似于传统计算机图形中的细节级别(LOD)的图像质量。

如下图 5 所示,在使用 6 种因子、504 × 378 像素的数据集上,新方法与 NeRF 的定量对比结果:

下表 1 中,研究者提供了不缓存网格和以高分辨率缓存时,FastNeRF 与 NeRF 在三种度量(PSNR、SSIM、LPIPS)上的对比,并给出了存在缓存时新方法的平均速度。

下表 2 为该方法与 NeRF 的速度比较。椅子(Chair)和乐高(Lego)的场景是以 800^2 的分辨率渲染的。犀牛角(Horns)和叶子(Leaves)场景图则是以 504 × 378 分辨率渲染的。该方法在存在缓存时速度没有低于 100FPS,并且经常会更快。

下表 3 为分量数量和网格分辨率对缓存轮船(ship)场景所需 PSNR 和内存的影响。注意到有多种因素都能够增加网格稀疏性。该研究发现 8 或 6 个分量是一种合理的折衷方案。

下图 6 为使用结合变形场网络的 FastNeRF 渲染的人脸图像。使用 FastNeRF 可以让人脸表情图像的渲染速度达到 30FPS。

end

我是王博Kings,一名985AI博士,华为云专家/CSDN博客专家,单个AI项目在Github上获得了2000标星,为了方便大家交流,附上了联系方式。

这是我的私人微信,还有少量坑位,可与相关学者研究人员交流学习 

目前开设有人工智能、机器学习、计算机视觉、自动驾驶(含SLAM)、Python、求职面经、综合交流群扫描添加CV联盟微信拉你进群,备注:CV联盟

王博Kings 的公众号,欢迎关注,干货多多

王博Kings的系列手推笔记(附高清PDF下载):

博士笔记 | 周志华《机器学习》手推笔记第一章思维导图

博士笔记 | 周志华《机器学习》手推笔记第二章“模型评估与选择”

博士笔记 | 周志华《机器学习》手推笔记第三章“线性模型”

博士笔记 | 周志华《机器学习》手推笔记第四章“决策树”

博士笔记 | 周志华《机器学习》手推笔记第五章“神经网络”

博士笔记 | 周志华《机器学习》手推笔记第六章支持向量机(上)

博士笔记 | 周志华《机器学习》手推笔记第六章支持向量机(下)

博士笔记 | 周志华《机器学习》手推笔记第七章贝叶斯分类(上)

博士笔记 | 周志华《机器学习》手推笔记第七章贝叶斯分类(下)

博士笔记 | 周志华《机器学习》手推笔记第八章集成学习(上)

博士笔记 | 周志华《机器学习》手推笔记第八章集成学习(下)

博士笔记 | 周志华《机器学习》手推笔记第九章聚类

博士笔记 | 周志华《机器学习》手推笔记第十章降维与度量学习

博士笔记 | 周志华《机器学习》手推笔记第十一章特征选择与稀疏学习

博士笔记 | 周志华《机器学习》手推笔记第十二章计算学习理论(上)

博士笔记 | 周志华《机器学习》手推笔记第十二章计算学习理论(下)

博士笔记 | 周志华《机器学习》手推笔记第十三章半监督学习

博士笔记 | 周志华《机器学习》手推笔记第十四章概率图模型

点个在看支持一下吧

消费级GPU、速度提升3000倍,微软FastNeRF实现200FPS相关推荐

  1. 消费级GPU、速度提升3000倍,微软FastNeRF实现200FPS高保真神经渲染

    作者|小舟.杜伟 来源|机器之心 近日,微软提出了一种基于 NeRF 的新系统 FastNeRF,用它来渲染逼真图像,速度能有多快呢?在高端消费级 GPU 上达到了惊人的 200FPS! 神经辐射场( ...

  2. 将端到端文本转语音速度提高38倍,全新语音合成系统FastSpeech 梅尔谱的生成速度提升270倍,微软和浙大联合推出

    将端到端文本转语音速度提高38倍,全新语音合成系统FastSpeech 梅尔谱的生成速度提升270倍,微软和浙大联合推出 目前,基于神经网络的端到端文本到语音合成技术发展迅速,但仍面临不少问题--合成 ...

  3. 阿里公开自研AI集群细节:64个GPU,百万分类训练速度提升4倍

    点上方蓝字计算机视觉联盟获取更多干货 在右上方 ··· 设为星标 ★,与你不见不散 编辑:Sophia 计算机视觉联盟  报道  | 公众号 CVLianMeng 转载于 :量子位 AI博士笔记系列推 ...

  4. 【云原生AI】Fluid + JindoFS 助力微博海量小文件模型训练速度提升 18 倍

    简介: 深度学习平台在微博社交业务扮演着重要的角色.计算存储分离架构下,微博深度学习平台在数据访问与调度方面存在性能低效的问题.本文将介绍微博内部设计实现的一套全新的基于 Fluid(内含 Jindo ...

  5. ZippyPoint: 一种基于学习的特征点提取+二进制描述子,速度提升5倍+,为移动平台提供一种ORB的替代方案...

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 作者丨Realcat 来源丨 计算机视觉SLAM 作者来自ETHZ Computer Vision实验 ...

  6. 阿里 AI 研究成果入选国际顶会 ICML 2020,AI 推理速度提升 3 倍

    近日,人工智能国际顶会ICML 2020公布了论文收录结果,阿里巴巴7篇论文入选,是入选论文数量最多的中国科技公司.ICML是机器学习领域全球最具影响力的学术会议之一,今年接受率仅为21.8%. 根据 ...

  7. AI一分钟 | 李开复:AI创业公司估值今年会降20%~30%;谷歌让搜索结果加载速度提升两倍...

    ▌李开复:AI 创业公司估值今年会降 20%~30% 创新工场创始人李开复的新书<AI·未来>昨天正式全球发售,在发布现场,李开复谈到目前国内 AI 创业企业现状时表示,今年国内 AI 创 ...

  8. 谷歌发布TF新工具:计算速度提升2倍,减少无效参数

    萧箫 发自 凹非寺 量子位 报道 | 公众号 QbitAI 一顿操作后,需要实时模糊背景的视频,看起来流畅了不少: 实时目标检测的延迟也更低了: 这是谷歌特意为移动设备和Web端开发的一系列新工具,可 ...

  9. names文件和data文件_data.table让你的读取速度提升百倍

    不知道大家有没有用read.table和read.csv读取过文件,当文件不大的时候你可能还感觉不出读取速度,但是当文件比较大的时候,比如有上万行的时候,你就会感觉到等待时间明显变长,甚至无法忍受. ...

最新文章

  1. SAD立体匹配算法在opencv中的实现
  2. ASP实现单条件和多条件组合查询的实例
  3. 《嵌入式》复习资料公共版
  4. C++ 从入门到入土(English Version)Section 8 : Recursion, Searching and Backtracking
  5. 多页Excel转换成PDF时如何保存为单独文件
  6. php提示返回,PHP指定方法的返回类型提示
  7. android高德地图截屏,地图截图功能
  8. KMS激活工具 HEU_KMS_Activator_CH_v7.8.4
  9. 使用GROUP BY分组
  10. 开启加盟模式,喜茶能否借此越过山丘?
  11. 嵌入式软件工程师—成长笔记#05
  12. html设置字体facename,CRichEdit控件操作使用
  13. 国家普通话水平测试官方软件,国家普通话水平测试题
  14. 浅谈web架构之架构设计(总结)
  15. 【seeprettyface.com】数据集:戴眼镜/笑容人脸数据集
  16. 键盘VK键值表---完整
  17. Linux 学习笔记——二、主机规划与磁盘分区
  18. 360良医搭载人工智能 让互联网医疗信息服务更精准
  19. 2019210025曾培圣
  20. 2021届 字节跳动 按岗位汇总算法高频题(统计牛客大量面经所得)

热门文章

  1. python编程规则_python编程规则
  2. 原生html冻结表头,CSS如何实现表头冻结效果
  3. python 表情包 gif_几行 python 代码合成 gif / 微信表情~与恶意合成软件说再见【文末附代码】...
  4. python语言的数字类型_Python的数字有哪些类型
  5. pcl如何设置colorbar_突然加更 | 子图、colorbar和标题
  6. java给按钮加声音_怎么在java中给按钮添加声音?
  7. 量化延时法时间测量_干货分享:直线度测量发展及几种方法详解
  8. cad 打开硬件加速卡_CAD卡顿?电脑带不动?几个简单实用的方法,解决CAD运行卡顿问题...
  9. Android表格拖拽排序,Android 拖拽排序控件 DragGridView
  10. 全连接神经网络_【模型解读】从“局部连接”回到“全连接”的Non-Local神经网络...