点上方计算机视觉联盟获取更多干货

仅作学术分享,不代表本公众号立场,侵权联系删除

转载于:量子位

AI博士笔记系列推荐

周志华《机器学习》手推笔记正式开源!可打印版本附pdf下载链接

这般丝滑的美食展示,是否让跟随镜头移动的你食指大动?

再看这放大镜里流畅变化的弹簧,你敢相信,这完全是用静态图像合成的吗?

没错,这样的动图并非截自视频,而是来自AI的合成大法。

甚至只需手机随手拍摄的十几张2D照片,就能实时渲染生成。

比起大名鼎鼎的谷歌前辈NeRF,这只名为NeX的AI,能直接把每秒渲染帧数从0.02帧提升到60帧。

也就是说,渲染速度能提升3个数量级。

细节之处,也更加接近真实效果。

这项已经入选CVPR 2021 Oral的研究,是怎么做到的?

项目地址:

https://nex-mpi.github.io/

论文地址:
https://arxiv.org/abs/2103.05606

像素参数与基函数结合

多平面图像(MPI)视图合成技术,使得不用3D建模,只用少数几张图像还原多视角逼真3D效果成为可能。

不过,此前的MPI主要采用的是标准RBGα表示法,简单说就是把图像转换成RGBα平面,以进行后续的计算。

这样做的局限性在于,其表示出的物体外观仅与漫反射表面有关,与视角无关。

这就极大地限制了MPI可以捕捉的物体和场景类型。

为此,来自泰国科学技术研究所VISTEC的研究人员提出:将每个像素的参数转化为基函数的系数,进行线性组合,并以此创建与视图相关的效果模型。

就如上图所示,多平面图像中每个像素都由alpha透明值、基色k0和视图相关的反射系数k1…kn组成。

将这些系数和神经网络预测的基函数进行线性组合,就产生了最终的颜色值。

如此一来,像金属勺子在不同视角下的反射效果这样的信息,都能在合成图像中显示出来。

具体到整个NeX的结构,对于输入图像,首先根据不同平面深度,对像素坐标(x,y)进行采样,以构建出MPI中的每个像素。

然后,把这个数据喂给多层感知机(MLP),得到alpha透明度,以及和视图相关的基础系数(k1,k2,…,kn)。

这些系数再与显式的k0一起,与另一个MLP预测的基函数相乘,生成RGB值。

输出图像,如公式1所示,为所有平面复合运算的结果。

而在细节效果的提升方面,研究人员人员发现,通过比较渲染图像和真实值之间的差距,对基色k0进行优化,就可以得到很好的效果,显著减轻网络压缩和细节重现的负担,减少迭代次数。

研究人员还补充说,NeX可以被理解成是隐式辐射场函数的离散抽样。

至于实时渲染,论文指出,NeX MPI中的每一个模型参数都可以转换为图像。而给定预先计算好的图像,就可以在OpenGL/WebGL的片段着色器中实现上述公式1,实现捕获场景的实时渲染。

实验结果

有NeRF珠玉在前,NeX具体到数据上,到底有怎样的提升?

在运行时间方面,输入17张分辨率为1008×756的照片,批量大小为1的情况下,使用单个英伟达V100训练,NeX的耗时大概为18小时。

使用WebGL,此场景可以以每秒60帧的速度被渲染出来。

而在同一台机器上运行,NeRF则需要大约55秒才能生成一帧。

也就是说,NeX的渲染速度比NeRF要快1000倍以上。

与SRN、LLFF和NeRF相比,在峰值信噪比、结构相似性和图像感知相似度这三个指标上,NeX都达到了最佳。

而在定性比较中,可以看到,与NeRF相比,在颜色均匀的区域,NeX细节更清晰,噪声更少,更接近真实值。

LLFF虽然细节表现也很好,但当结果以视频形式呈现时,会产生跳跃和扭曲伪影。

可上手试玩

对了,如果你对NeX感兴趣,还可以到项目官网亲自感受一下实时渲染Demo。

还有手机版和VR版哟。

end

我是王博Kings,一名985AI博士,华为云专家/CSDN博客专家,单个AI项目在Github上获得了2000标星,为了方便大家交流,附上了联系方式。

这是我的私人微信,还有少量坑位,可与相关学者研究人员交流学习 

目前开设有人工智能、机器学习、计算机视觉、自动驾驶(含SLAM)、Python、求职面经、综合交流群扫描添加CV联盟微信拉你进群,备注:CV联盟

王博Kings 的公众号,欢迎关注,干货多多

王博Kings的系列手推笔记(附高清PDF下载):

博士笔记 | 周志华《机器学习》手推笔记第一章思维导图

博士笔记 | 周志华《机器学习》手推笔记第二章“模型评估与选择”

博士笔记 | 周志华《机器学习》手推笔记第三章“线性模型”

博士笔记 | 周志华《机器学习》手推笔记第四章“决策树”

博士笔记 | 周志华《机器学习》手推笔记第五章“神经网络”

博士笔记 | 周志华《机器学习》手推笔记第六章支持向量机(上)

博士笔记 | 周志华《机器学习》手推笔记第六章支持向量机(下)

博士笔记 | 周志华《机器学习》手推笔记第七章贝叶斯分类(上)

博士笔记 | 周志华《机器学习》手推笔记第七章贝叶斯分类(下)

博士笔记 | 周志华《机器学习》手推笔记第八章集成学习(上)

博士笔记 | 周志华《机器学习》手推笔记第八章集成学习(下)

博士笔记 | 周志华《机器学习》手推笔记第九章聚类

博士笔记 | 周志华《机器学习》手推笔记第十章降维与度量学习

博士笔记 | 周志华《机器学习》手推笔记第十一章特征选择与稀疏学习

博士笔记 | 周志华《机器学习》手推笔记第十二章计算学习理论(上)

博士笔记 | 周志华《机器学习》手推笔记第十二章计算学习理论(下)

博士笔记 | 周志华《机器学习》手推笔记第十三章半监督学习

博士笔记 | 周志华《机器学习》手推笔记第十四章概率图模型

点个在看支持一下吧

CVPR2021 Oral|只用静态图,实时渲染出丝滑3D效果相关推荐

  1. CVPR 2021 Oral|只用静态图像,就能实时渲染出丝滑3D效果

    作者丨鱼羊 来源丨量子位 编辑丨极市平台 [导读] 入选CVPR2021 Oral,NeX的AI,能直接把每秒渲染帧数从0.02帧提升到60帧,渲染速度比NeRF要快1000倍以上. 这般丝滑的美食展 ...

  2. 只用静态图像,就能实时渲染出丝滑3D效果 | CVPR 2021 Oral

    鱼羊 发自 凹非寺  量子位 报道 | 公众号 QbitAI 这般丝滑的美食展示,是否让跟随镜头移动的你食指大动? 再看这放大镜里流畅变化的弹簧,你敢相信,这完全是用静态图像合成的吗? 没错,这样的动 ...

  3. 为什么Unreal 4引擎能轻易实时渲染出vray要花半天才能渲染出的场景

    为什么Unreal 4引擎能轻易实时渲染出vray要花半天才能渲染出的场景? 这不是真的!This is Unreal! 看了这个文章,大为感慨.如果有人以unreal 4为基础开发渲染软件,和rhi ...

  4. typora+picgo+gitee搭建免费图床纵享丝滑

    typora+picgo+gitee搭建免费图床纵享丝滑 0.写在前面 由于之前自己在github搭了自己的博客,伴随之而来的一系列问题.如github不显示图片,github图床加载太慢等一系列问题 ...

  5. paddle静态图训练,训练集和测试集效果都有很好,但验证集上效果很差

    在paddle静态图训练中,训练集和测试集效果都有很好,但验证集上效果很差 在paddle的训练中,如果使用这样的方式进行训练 main_program = fluid.default_main_pr ...

  6. oc实时渲染的图如何导出_如何使用C4D制作逼真的循环三维动画

    点击上方蓝字关注我哦! 嗨 朋友 又到周五了,周末打算干啥?睡觉-玩游戏(放松休息).约朋友(经营感情).回家(看望父母).充电(优化升级)总之怎么放松怎么来.无论你周末做怎样的计划但只要你想充电,就 ...

  7. 使用VMD中的Tachyon渲染出透明逼真的水盒子效果

    1.概述 在本教程中将重点向你展示如何通过VMD中的Tachyon制作一个高质量的可视化图像.本文假设你对vmd有一定了解(最基本的打开载入分子即可).关于vmd制作图像的快速入门中文教程,本例所使用 ...

  8. 本周推荐 | 基于 canvas 实现 H5 丝滑看图体验

    推荐语:随着机器算力及性能的提升,基于原生Web体系的富交互体验也可以媲美原生,本文作者通过Canvas + Web手势从零实现了大图浏览的交互效果,并在体验上不输Native,是一次不错的技术尝试, ...

  9. CVPR2021(Oral) 商汤、港中文实现单目人脸重建新突破: 基于生成网络的渲染器!几何形状更精准!渲染效果更真实!...

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 近日,商汤-港中文联合实验室提出基于风格化对抗生成器的人脸渲染器,用于取代传统图形学基于栅格化的渲染器 ...

最新文章

  1. 魔兽世界10月15日服务器维护,《魔兽世界》怀旧服将于10月15日开放新服务器
  2. 提取IPv6地址的编码信息
  3. 10道C++输出易错笔试题收集(敢进来挑战吗?)
  4. 国际农化巨头战略转移-丰收节贸易会:未来农化发展之路
  5. C# ref跟out
  6. 前端学习(3349):数组方法的运用和数值
  7. remove()方法
  8. axios代理跨域 cli4_vuecli 3.0之跨域请求代理配置及axios路径配置 莫小龙
  9. bzoj 1500 [NOI 2005] 维修数列
  10. 三星电视与计算机连接网络设置,三星电视怎么连接网络看电视?
  11. Decorator 装饰(结构型)
  12. tensorflow手动实现算法之一线性回归
  13. iOS开发-思维导图(初级)
  14. python正负数转换_python – 将正/负数舍入到最接近的“整数”
  15. iOS-百度地图之——POI检索失败BMK_SEARCH_PERMISSION_UNFINISHED
  16. 25岁,一个北漂程序员,如果不想35 岁被淘汰,请把它当成一种信仰!
  17. 清差额征税和简易计税的适用情形
  18. 蒋川最佳棋手 孙勇征最大突破
  19. Rockchip基于RK3566/RK3568 WiFi AP6256调试笔记
  20. 计算机管理恢复分区,如何在Windows中擦除恢复分区 | MOS86

热门文章

  1. mysql update 多个字段_MySQL数据库基础
  2. 贪心算法两船装载问题Java_贪心算法-最优装载问题
  3. mysql中phpmyadmin安装教程_phpmyadmin安装方法
  4. java 线程同步的list_java线程生产者与消费者实例(使用List实现同步)
  5. STM32 HAL库 UART 串口读写功能笔记
  6. 【重构之法】代码的坏味道
  7. 夺命雷公狗---linux NO:19 linux下的vi交换文件
  8. react-native 安装的时候遇到的问题
  9. 1001. A+B Format
  10. 属于attribute还是property。