近日,商汤-港中文联合实验室提出基于风格化对抗生成器的人脸渲染器,用于取代传统图形学基于栅格化的渲染器来进行3D模型的重建。该方法构建了一种从输入3D模型到生成图像的平滑梯度,同时可以以低精度建模获得渲染更高质量的图像。与此同时,通过对生成网络式的渲染器反向传播算法,能够获得更具有图像细节特征的重建人脸3D模型。

  • 论文名称:Inverting Generative Adversarial Renderer for Face Reconstruction

  • 论文链接:https://arxiv.org/pdf/2105.02431.pdf

  • 项目链接:https://github.com/WestlyPark/StyleRenderer

从左到右:source video, face reconstruction results, generated normal maps

      01      

导言

从单目人脸图像获得人脸的3D模型是一项颇具挑战的任务。它以一张RGB图像作为输入,重建相应的三维人脸网格。传统方法为了使得得到的3D模型更接近真实图像,一般采用图形学中基于栅格化的渲染来进行模型参数的优化。一方面为了尽可能的将模型逼近图像,会采用更高自由度的参数化模型表达人脸的表面纹理,另一方面,在渲染结果比对上会采用模糊化的方式使渲染结果与图像之间的差异以一种可微分的方式传递给3D模型。

图1  不同渲染器的渲染效果对比

然而,主要基于图形学基础的可微渲染器简化了真实世界中光照、反射等的真实机制,因而难以生成足够真实的图像。如图1所示,第二列到第五列的方法的渲染效果都不真实,这给优化或训练过程带来了大量的噪声。

为了使得从3D模型的几何信息到生成图像的颜色变化之间的关系更准确和连续,该工作提出了一种基于对抗生成网络的方式进行3D模型的渲染。利用该渲染器可以得到更真实的图片渲染结果,同时具有更合适的微分性能能够进行更好的3D模型参数的提取。

      02      

基于生成网络的渲染器

受最近基于StyleGAN的真实人脸生成器的启发,为了实现人脸几何参数受控的生成器,文章提出了基于3D人脸几何信息的渲染模块,在保持用随机隐变量生成纹理的同时显示地加入了人脸的几何信息。

图2  整体网络结构

具体来说,对于每个模块的4维输入特征(批次、通道数、长、宽),StyleGAN2提出在通道数上面进行风格的注入,以达到对生成结果的调控,而在长宽的图像维度上,文章提出同时注入与人脸几何相关的法向量信息,以监督整个人脸的在图像中的位置和五官的分布。该注入以乘积的形式添加保持特征图在不同几何信息的位置具有针对性的响应。

图3  渲染模块网络结构

为了使得生成网络得到图像的几何属性与输入条件的一致性,文章利用几何学方法渲染一批合成人脸训练了一个法向量监督网络(SfSNet)作为弱监督保持法向量的近似一致性。由于生成网络本身对于人脸几何信息的添加方式导致人脸3D模型参数和生成图像的结果之间的关系在优化时更容易建立起来。

文章还提出为了控制生成图像的纹理信息和人脸的几何信息能够解耦,在训练过程中采用交换几何信息和注入变量信息的方式,并利用预训练的关键点检测保持人脸几何信息的一致性和人脸识别网络提取的特征保持纹理信息的一致性。

图4  不同隐变量的渲染效果

训练好的生成式渲染器(GAR)可以根据不同的法向图和隐编码渲染出对应的图像,如图4所示。

      03      

基于反向渲染的人脸重建技术

反向渲染技术可以充分利用生成式渲染器的优势,以生成与给定图像相似的图片为目标,反推出输出的人脸形状与纹理。

为了解决同时优化人脸参数模型和在生成器中使用的表征人脸纹理的隐变量的问题,文章设计了与生成器结构对称的回归网络来估计隐变量的初始优化值。在此基础上,进行网络本身相对于输出图像的梯度反传进行人脸几何参数的优化,进而得到更具细节的人脸3D模型。

人脸重建效果的对比如下图所示。由于生成式渲染器的引入消除了渲染图片与目标图片之间的偏差,因此渲染图片与目标图片之间的距离可以更好反映渲染器的法向输入与真实3D几何之间的差异,从而使该方法获得了比之前方法更精准的人脸重建结果。

图5 人脸重建效果对比

      04      

应用

该方法不仅在相关数据集上取得了重建精度比较好的效果,而且能够在优化参数后根据修改人脸的几何信息对生成图像进行编辑。在后续对于类似难以建模的物体进行3D提取的过程中可能有更好的应用。

图6 人脸编辑效果

      05      

总结

该论文实现了单目图像人脸重建的新突破,提出一个更真实的生成式渲染器(GAR)与一种反向渲染以实现人脸重建的方法。生成式渲染器的渲染效果比传统图形学渲染器更加真实,从而减小渲染图片与真实图片之间的差异。而反向渲染技术充分利用所提出的生成式渲染器的优势,以生成与给定图像相似的图片为目标,反推出输出的人脸形状与纹理。

该算法不但在点云的平均误差上达到目前人脸重建领域的领先效果,在几何的相似度和精细度上也大大超越已有方法。该论文代码已开源,快用你自己的照片试试吧!

CVPR2021(Oral) 商汤、港中文实现单目人脸重建新突破: 基于生成网络的渲染器!几何形状更精准!渲染效果更真实!相关推荐

  1. CVPR2021(Oral) 商汤、港中文实现单目人脸重建新突破: 基于生成网络的渲染器!几何形状更精准!渲染效果更真实!...

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 近日,商汤-港中文联合实验室提出基于风格化对抗生成器的人脸渲染器,用于取代传统图形学基于栅格化的渲染器 ...

  2. 重磅!商汤港中文等将开源ECCV2018MS COCO检测比赛冠军代码库

    重磅!商汤&港中文等将开源ECCV2018MS COCO检测比赛冠军代码库 原文出处: 我爱计算机视觉 来自商汤科技.港中文.浙大.悉尼大学.南洋理工大学的研究人员组成的团队MMDet,赢得了 ...

  3. 超越 FPN 和 NAS-FPN!商汤港中文提出 FPG,特征金字塔网格强势登场!

    论文标题:Feature Pyramid Grids 作者团队:商汤&港中文(陈恺&林达华)&南洋理工大学&FAIR 论文链接:https://arxiv.org/ab ...

  4. CVPR2020 | 商汤-港中文等提出PV-RCNN:3D目标检测新网络

    关注上方"深度学习技术前沿",选择"星标公众号", 资源干货,第一时间送达! 作者:不一样的子湘 知乎链接:https://zhuanlan.zhihu.com ...

  5. 强烈推荐!商汤-港中文MMLab开源图像视频超分辨率工具箱MMSR

    点击我爱计算机视觉标星,更快获取CVML新技术 近一年,图像视频超分辨率突然变得异常火热,各大AI巨头和新锐均在发力. 52CV曾经第一时间报道了在今年CVPR 2019上 商汤EDVR算法获NTIR ...

  6. CVPR2021 | 北航商汤耶鲁口头报告

    点上方计算机视觉联盟获取更多干货 仅作学术分享,不代表本公众号立场,侵权联系删除 转载于:量子位 报道 | 公众号 QbitAI AI博士笔记系列推荐 周志华<机器学习>手推笔记正式开源! ...

  7. 基于单目图像无监督学习的深度图生成

    原文首发于微信公众号「3D视觉工坊」:基于单目图像无监督学习的深度图生成 如图1所示,网络的输入只需左相机图像,在训练阶段通过左右相机图像作为监督.注意,这里的无监督学习指的是,不需要深度图作为监督, ...

  8. 旷视科技完成4.6亿美元C轮融资,打破商汤4.1亿美元单轮融资记录

    来源:亿欧 概要:本轮融资很可能会被用于加快在城市综合大脑及手机智能领域的技术落地,打造智慧城市. 2017年10月31日消息,人工智能公司旷视科技(Face++)已于近期完成C轮融资,本轮融资金额约 ...

  9. 商汤发布首份业绩报告,数字经济新拐点,商汤的价值逻辑变了吗?

    3月25日,商汤科技发布港股上市以来首份年度业绩报告,于2021年实现营收47亿元,同比增长36.4%,毛利率保持在69.7%高位. 除了商汤自身的显著增长,财报中更透露出人工智能产业正走到历史发展的 ...

最新文章

  1. nokia 上的好玩应用(转载)
  2. Jenkins报错‘Gradle build daemon disappeared unexpectedly‘的问题解决
  3. mac版python连接mysql_Mac下Python连接MySQL · BlBana’s BlackHouse
  4. java如何绘制图表_java绘制excel图表(jxcell)
  5. NSString/NSMutable字符串——韩俊强…
  6. idea运行项目报错Cannot run program “C:\Program Files\Java\jdk1.8.0_121\bin\java.exe......解决办法
  7. 【项目】springboot中使用kaptcha生成验证码,登录时密码加盐处理
  8. SAP Spartacus里的产品主数据显示的数据源
  9. ubuntu下mysql-python模块的安装
  10. 2017蓝桥杯省赛---java---C---1(外星日历)
  11. hook NSArray 方法在debug模式下会崩溃, 在release模式下会返回nil
  12. 坚果pro2刷机分享
  13. mac查看进程 总是忘记
  14. SpringBoot 中解决跨域请求
  15. 不同行业的软件安全标准介绍和对比
  16. 分享76网络科技88教育教学47公司企业PPT模板
  17. Fiddler抓包工具抓取手机APP数据
  18. 苹果电脑计算机找不到打印机,在苹果电脑上连接打印机可以这样操作
  19. php 抓取百度快照时间,php获取网站百度快照日期的方法
  20. 如何在以太坊网络上发布自己的代币

热门文章

  1. gin post 数据参数_Gin 使用示例(四):绑定查询字符串或 POST 数据
  2. easyui datagrid不是相邻的能合并单元格吗_万能的Ctrl+E快捷键,学会能一键批量解决Excel中90%的问题!...
  3. 计算机硬件技术 实验的软件,计算机硬件技术基础软件实验讲义.doc
  4. 如何使用Linux内核中没有被导出的变量或函数
  5. dw生日祝福网页制作教程_明星祝福生日视频制作
  6. bootstrap图片叠加_图片 | Images
  7. jvm优化_使用Java流和In-JVM-Memory的超低延迟查询
  8. mega_[MEGA DEAL] Ultimate JavaScript电子书和课程包(96%折扣)
  9. Linux中文件描述符1,linux内核中的文件描述符(一)--基础知识简介
  10. 计算机速录学什么,学速录的要求有哪些