简介

主页:https://lolnerf.github.io/

方法通过在共享潜在空间(左)条件下使用单一神经网络重构大量的单视图图像集合来学习形状和外观的空间。这允许从图像中提取一个三维模型,并从新的视角进行渲染(右)

贡献点

  1. 提出了一种从单视图图像中学习三维重建目标类别的方法,将训练复杂度与图像分辨率解耦;
  2. 表明单个视图足以在没有任何几何监督的情况下学习高质量的几何预测(例如深度)
  3. 方法在通过重建固定的图像和新颖的视图来表示学习类别的物体外观方面超过了对抗方法。

实现流程

NeRF回顾



自动解码器
自动解码器,也被称为生成潜优化(GLO),是一组生成模型,无需使用编码器或鉴别器即可学习,通过为训练数据集中的每个不同元素分配一行代码表来直接学习代码,这些代码与模型参数的其余部分作为可学习变量进行协同优化。

LOLNeRF

学习每个图像的潜在代码表,以及前景和背景nerf。体积渲染输出受制于每个训练像素的每射线RGB损失,以及针对图像分割器的alpha值。摄像机的对齐是从二维地标输出到特定类的标准3D关键点的最小二乘拟合中派生出来的

最小化三个损失的加权和来训练网络参数和潜码Z

训练图像 IkI_kIk​ 的标准 L2 光度重建损失除以像素 prgb

Lrgb


扩展了NeRF的“单场景”(即过拟合/记忆)公式,通过加入一个自动解码器架构来支持学习形状的潜在空间

在这种改进的体系结构中,主要NeRF骨干网络的条件是每个对象的潜码 z∈RDz∈R^Dz∈RD,以及 l 维位置编码 γL(x)γ^L(x)γL(x)

密度和辐射函数的形式是 σ(x|z) 和 c(x|z)

考虑一个公式,其中亮度不是视图方向 d 的函数

这些潜码是潜表 Z∈RK×DZ∈R^{K×D}Z∈RK×D 中的行,将潜表初始化为 0K×D0^{K×D}0K×D,其中 K 为图像数

这种架构使得精确重构训练示例成为可能,而无需对编码器模型进行大量额外的计算和内存,并避免了从训练图像中提取3D信息需要卷积网络

训练该模型遵循与单场景NeRF相同的过程,但从数据集中的所有 K 张图像中抽取随机射线,并将每条射线与图像中采样对象对应的潜在代码相关联。

Foreground-Background Decomposition

使用一个单独的模型来处理背景细节的生成,使用一个低容量的模型 Cbg(d∣z)C_{bg}(d|z)Cbg​(d∣z)作为背景,它预测每条射线的亮度,结合背景和前景色,使用NeRF密度函数的透明度值进行渲染

监督前景/背景分离并不总是必要的

从纯色背景颜色和360◦摄像头分布中自然地学习了前景分解

当预先训练的模块可用来预测训练图像的前景分割时,还应用一个额外的损失来鼓励NeRF体积的透明度与这个预测一致

SI(⋅)S_I(·)SI​(⋅)是应用于图像 IkI_kIk​ 并在像素 p 处采样的预训练图像分割器

在人脸数据集上进行训练时,对(7)中的预训练模块使用MediaPipe自拍分割,λ 掩码=1.0。

Hard Surfaces

有了足够的输入图像和足够的纹理表面,多视图一致性将有利于创建从空到实的硬过渡,该属性在单个视图情况下不成立。因为对应于每个潜码的场函数只从一个视点监督,这通常会导致沿视点方向的表面模糊

对权重 w 作为拉普拉斯分布的混合分布的概率施加先验,其中一个在权值为 0 附近的模态,另一个在权值为 1 附近的模态:

该分布是峰值的,并将鼓励一个稀疏解,其中开放区间(0,1)中的任何值 w 都是不鼓励的,将此先验转换为损失

满足该约束条件的 σ(x) 的大小取决于采样密度,鼓励密度产生一个阶梯函数,该函数至少在一个采样区间内饱和采样权值,通过构造,它适合于被建模场景的规模

Camera Parameters

体绘制需要相机参数将每个像素与用于计算样本位置的射线相关联,摄像机是通过运动结构对输入图像集进行估计,单视图用例,由于深度模糊,这是不可能的.

使方法与单视图图像兼容,使用了MediaPipe Face Mesh预训练的网络模块来提取出现在对象类的一致位置的2D地标

地标和分段器-(对两个输入标识的地标和分段器网络的输出进行采样。蓝色圆圈(•)表示标识的地标。用于人脸的五个地标的示例网络输出

然后,利用“形状匹配”最小二乘优化将这些地标位置与标准3D地标位置的投影进行对齐,以获得相机参数的粗略估计

Conditional Generation

给定一个预先训练的模型,可以找到一个潜在的代码 z,它可以重建训练集中不存在的图像,由于潜伏表是与NeRF模型参数并行学习的,可以将这一过程视为潜伏表中额外一行的微调优化,这一行被初始化为潜表现有行的平均 μZμ_ZμZ​,并使用与主模型相同的损耗和优化器进行优化

对于每种方法,展示了一个适合于训练方法的例子:对于π-GAN,一个从训练分布中采样的潜伏代码,对于论文的,一个学习到的重建训练图像的潜伏代码。由于在更高分辨率的图像上进行训练,论文的方法恢复了更清晰的细节。

对于用两种方法重建的同一图像的新视图的比较

Unconditional Generation

为了从模型学习到的空间中对新对象进行采样,从由潜表 Z 的行定义的经验分布 Z 中对潜码进行采样。 将 Z 建模为一个多元高斯,通过对 Z 的行进行主成分分析发现其均值为 μZμ_ZμZ​,协方差为χZχ_ZχZ​。类似于其他生成模型对潜变量使用高斯先验,当抽样距离分布均值较远时, 观察到样本的多样性和质量之间的权衡。因此, 采用GAN中常用的“截断技巧”来控制这种权衡。

50、LOLNeRF: Learn from One Look相关推荐

  1. 瑟瑟发抖!2020年博士学位论文将抽查50%、硕士20%!

    转自:考博圈 来源:教育部.科研大匠 编辑:学长 3月2日,教育部在其官网发布了题为:中山大学坚持与国家战略和区域发展同频共振 推动研究生教育内涵建设的简报.简报中指出: 中山大学严把"出口 ...

  2. apache2.4.6支不支持jsp_Spring Boot中文参考指南(2.1.6)50、Kotlin 支持

    上一篇[49.4.测试你的自动配置] 下一篇[52.启用生产就绪功能] 英文原文:https://docs.spring.io/spring-boot/docs/2.1.6.RELEASE/refer ...

  3. R语言ggplot2可视化:使用patchwork包(直接使用加号+)将两个ggplot2可视化结果横向组合、接着再和第三个图像横向组合起来(三幅图各占比例为50%、25%、25%)

    R语言ggplot2可视化:使用patchwork包(直接使用加号+)将两个ggplot2可视化结果横向组合.接着再和第三个图像横向组合起来(三幅图各占比例为50%.25%.25%) 目录

  4. 有7克、2克砝码各一个,天平一只,如何只用这些物品三次将140克的盐分成50、90克各一份?

    微软面试题:有7克.2克砝码各一个,天平一只,如何只用这些物品三次将140克的盐分成50.90克各一份?(4种解法) 解法很多,仁者见仁智者见智: 1 ): 把2g和7g砝码放在同一边称量出9g盐 把 ...

  5. 面试题:有7克、2克砝码各一个,天平一只,如何只用这些物品称三次,将140克的盐分成50、90克各一份?...

    问题:面试题:有7克.2克砝码各一个,天平一只,如何只用这些物品称三次,将140克的盐分成50.90克各一份? 解法一: ①用天平将盐分成70g两份,即140 ->70 + 70; ②用天平将其 ...

  6. 【面试智力题】有7克、2克砝码各一个,天平一只,如何只用这些物品三次将140克的盐分成50、90克各一份?

    问题描述 有7克.2克砝码各一个,天平一只,如何只用这些物品三次将140克的盐分成50.90克各一份? 解法一 第一次:2+7->称9g盐 第二次:9+7->称16g盐 第三次:16+7- ...

  7. 设有6个有序表A、B、C、D、E、F,分别含有10、35、40、50、60和200个数据元素,各表中元素按升序排列。要求通过5次两两合并,将6个表最终合并成1个升序表,并在最坏情况下比较的总次数达到最

    设有6个有序表A.B.C.D.E.F,分别含有10.35.40.50.60和200个数据元素,各表中元素按升序排列.要求通过5次两两合并,将6个表最终合并成1个升序表,并在最坏情况下比较的总次数达到最 ...

  8. 【汇正财经】指数分化,科创50、创业板强势

    盘面回顾: 今天股指分化,科创50.创50全天领涨沪指,上证50继续低迷,截止收盘,沪指跌0.77%,创业板指涨0.65%,两市成交额8837亿元.板块方面,国资云.数据安全.软件开发等板块领涨,煤炭 ...

  9. (称重问题)有7克、2克砝码各一个,天平一只,如何只用这些物品三次将140克的盐分成50、90克各一份

    问题描述 有7克.2克砝码各一个,天平一只,如何只用这些物品三次将140克的盐分成50.90克各一份? 解法一 第一次:2+7->称9g盐 第二次:9+7->称16g盐 第三次:16+9- ...

  10. 有7克、2克砝码各一个,天平一只,如何只用这些物品三次将140克的盐分成50、90克各一份

    题目: 有7克.2克砝码各一个,天平一只,如何只用这些物品三次将140克的盐分成50.90克各一份? 解法一 第一次:用2g和7g砝码->称9g盐 第二次:将7g砝码放入第一次称的9g盐中-&g ...

最新文章

  1. wordcount代码_Scala小案例之wordcount
  2. php在线炒河粉,在线炒河粉表情包
  3. oracle win10家庭版,Windows10远程报错:由于CredSSP加密Oracle修正(ps:Win10家庭版)
  4. tomcat配置虚拟目录,虚拟目录,tomcat目录,tomcat服务器,网站图片虚拟目录
  5. 趣说游戏AI开发:曼哈顿街角的A*算法
  6. C++ TR1、TR2与boost的关系
  7. 纸的大小图解_图解常见纸张开数尺寸印前小常识
  8. 使用OpenCV,Keras和Tensorflow构建Covid19掩模检测器
  9. html地图缩放比例,百度地图之添加控件——比例尺、缩略图、平移缩放
  10. Android入门(15)| 网络
  11. es6 Promise 的应用
  12. 为了彻底理解乱码问题,一怒之下我把字符集历史扒了个底朝天
  13. linux下静态链接库和动态链接库
  14. 当前没有可用的服务器_调研Redis高可用两种方案
  15. ubuntu 10.04下vmware tools安装和一些应用
  16. 数据结构严蔚敏(c语言版)课后算法题答案-树和二叉树
  17. 惠普HP Photosmart 7960 打印机驱动
  18. SPI通信协议技术说明文档
  19. jquery蔚蓝网总结三个页面
  20. linux怎样编译安装pidgin,Ubuntu 10.04编译安装Pidgin-2.7.3整个过程

热门文章

  1. .bat文件批处理命令语法格式ech,goto,set,for,call,choise,at,set,定时关机命令
  2. 智邦科技下一代新技术发布会@MWC上海
  3. 填充因子设置的一般性准则和指导
  4. Unity高德定位获取天气预报
  5. iOS 新浪新闻首页卡片滚动特效实现
  6. mysql5.7越用c盘越小_Windows7的C盘可用空间为什么越用越小呢?
  7. 现代密码学-CA与数字证书详解
  8. java生成二维码QRcode方式
  9. 病毒分析三:勒索病毒分析
  10. 你有没有见过5GB大小的图片?