文章目录

  • 创新点
  • 算法
    • Body-guided normal prediction
    • Local-feature based implicit 3D reconstruction
  • 实验
    • 评估方式
    • 实验结果
    • 应用
  • 结论

论文: 《ICON : Implicit Clothed humans Obtained from Normals》
github: https://github.com/yuliangxiu/icon

创新点

现有方法需要3D扫描或者具有精心控制的2D图像进行3D重建,作者提出ICON,可通过不受约束的2D图像建模,结合所有建模结果生成动画;
现有方法对各种姿势人体3D建模不够鲁棒,由于使用全局特征进行编码,对全局姿势比较敏感;为解决这个问题,ICON使用局部特征。
在AGORA和CAPE数据集上,即使训练数据有限,ICON获得SOTA,而且在非同分步数据集上也比较鲁棒。

算法

mesh-based方法具有很好的正则化,而深层隐式函数具有更强的表现力;ICON将两者结合。ICON输入穿衣的人体RGB图及SMPL人体估计,输出穿衣的像素级3D重构结果;

ICON结构如图3,主要包括两个模块:Body-guided normal预测、基于局部特征隐式三维重建。

Body-guided normal prediction

Body-guided normal预测流程:
1、使用PyMAF从图像III估计SMPL mesh, M(β,θ)∈RN×3M(\beta,\theta)\in R^{N\times 3}M(β,θ)∈RN×3;
2、使用PyTorch3D中可微渲染器DR,从前后两面渲染M得到SMPL-body normalNb={Nfrontb,Nbackb}N^b=\{N^b_{front}, N^b_{back}\}Nb={Nfrontb​,Nbackb​},如式1;
3、将NbN^bNb与原图III concat后,通过网络GN={GfrontN,GbackN}G^N=\{G^N_{front}, G^N_{back}\}GN={GfrontN​,GbackN​}得到预测clothed-body normal maps,N^c={N^frontc,N^backc}\hat N^c=\{\hat N^c_{front}, \hat N^c_{back}\}N^c={N^frontc​,N^backc​},如式2;

4、训练GNG^NGN的损失函数如式3,

其中,Lpixel=∣Nvc−N^vc∣,v={front,back},LVGGL_{pixel}=|N^c_v - \hat N^c_v|,v=\{front,back\},L_{VGG}Lpixel​=∣Nvc​−N^vc​∣,v={front,back},LVGG​为感知损失,有助于恢复细节。
精细化SMPL
准确的SMPL body有助于生成质量更佳的clothed-body normals,但是实际中不会生成像素级对齐的SMPL fit;因此,在推理时,SMPL fit依靠SMPL-body normal maps NbN^bNb和预测的clothed-body normal maps NcN^cNc之间的差异进行优化,如图4;

SMPL的参数优化损失函数如式4、5

其中,LN_diffL_{N_{\_diff}}LN_diff​​为normal map的L1损失,LS_diffL_{S_{\_diff}}LS_diff​​为SMPL body normal-map轮廓SbS^bSb与人体mask S^c\hat S^cS^c之间L1损失。
ICON在推理时,交替进行a.使用预测的clothed-body normal N^c\hat N^cN^c优化SMPL mesh;b.使用精细化SMPL mesh预测N^c\hat N^cN^c;

Local-feature based implicit 3D reconstruction

给定预测的clothed-body normal maps N^c\hat N^cN^c及SMPL-body mesh MMM,基于局部特征FPF_PFP​回归3D surface,FPF_PFP​如式6,

其中,FsF_sFs​为point P到最近body point Pb∈MP^b\in MPb∈M的有符号距离;FnbF^b_nFnb​为PbP^bPb的barycentric surface normal;FncF^c_nFnc​为从N^c={N^frontc,N^backc}\hat N^c=\{\hat N^c_{front}, \hat N^c_{back}\}N^c={N^frontc​,N^backc​}提取的normal向量;
FPF_PFP​经过隐函数IF(MLP网络)IF(MLP网络)IF(MLP网络),估计点P的occupancy o^(P)\hat o(P)o^(P),通过MSE损失训练IFIFIF;

实验

评估方式

作者使用三种评估方式:
Chamfer距离: 计算真值scan与重构mesh之间距离;这种评该评估方法捕获了较大的几何差异,但遗漏了较小的几何细节。

P2S距离: CAPE数据集scan包含大的空洞,为了排除孔洞影响,我们记录scan点到最近重构表面点之间距离,为Chamfer距离的单向版本;
Normal difference: 表示使用重构的及真值surface分别进行渲染normal图片,计算两者之间L2距离,用于捕获高频几何细节误差。

实验结果

实验结果如表2,

实验结果表明:
1、如表2-A,ICON超过所有原始SOTA方法,ICON泛化性强,;
2、如表2-B,没有SMPL-X-body引导,误差变大,使用body引导,可有效改善遮挡部位重建,如图5.

3、表2-C,作者评估局部特征FPF_PFP​的重要性,作者将局部特征FPF_PFP​替换为使用2D卷积提取全局特征,应用于image及clothed-body normal map及仅应用于clothed-body normal maps,结果表明在非同分布数据集CAPE-NFP上,重建表现比较差。
如图6,作者对不同方法使用不同量级数据进行训练,结果表明,ICON始终优于其他方法,同时仅使用少量数据即可达到SOTA性能,作何归因于使用局部特征,使得泛化性增强.

4、表2-D,SMPL-X从图像估计结果可能无法于图中身体像素点完全对齐。ICON需要对SMPL-X shape及pose不同噪声级别都比较鲁棒,ICON+BR使用噪声性能与PaMIR*使用真值性能相当。

应用

动画生成。
作者将视频帧进行3D重建,重建结果输入SCANimate,得到动画输出,如图8b。

结论

作者提出的ICON可以从图片鲁棒地生成3D clothed-body person,其准确性和真实性超越了现有方法。这有两个关键:
1、使用3D body model,同时迭代优化body model;
2、使用局部特征消除与全局姿态相关性;
问题:
如图7,对于宽松衣服重建效果不佳,因为body是在正交视角下训练的,无法产生透视效果,因此产生不对称的四肢或解剖学上不可能的形状。

人体3D重建-ICON论文解读相关推荐

  1. CVPR 2020 | 《Learning to Transfer Texture from Clothing Images to 3D Humans》 论文解读

    作者和机构 德国马普所,SMPL的论文也出自该单位,三作Gerard也是SMPL论文的作者 解决的问题 通过服装的正面和背面图实时生成3D模型 动机 该研究有助于3D人体渲染,生成数据以供网络学习,虚 ...

  2. CVPR2022-图像恢复重建Restormer论文解读

    CVPR2022文献解读之Restormer 图像恢复重建: Restormer: Efficient Transformer for High-Resolution Image Restoratio ...

  3. 论文解读:基于深度相机的3D建模 2020最新综述

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 作者丨安如夏@知乎 来源丨https://zhuanlan.zhihu.com/p/299489800 ...

  4. Face Super-Resolution Guided by 3D Facial Priors(ECCV2020)论文解读

    Face Super-Resolution Guided by 3D Facial Priors(ECCV2020)论文解读 论文地址:https://arxiv.org/pdf/2007.09454 ...

  5. 论文解读:利用结构隐代码的隐神经表示方法来合成动态人体的新颖视角

    从稀疏多视点视频合成表演者新颖视角图像.数据输入是通过同步的RGB相机捕获的表演者视频.体神经捕获表演者的3D几何和外表,用来进行3D重建和新颖视角合成. 01 摘要 本论文主要解决在稀疏排列相机情况 ...

  6. CVPR2020论文解读:3D Object Detection三维目标检测

    CVPR2020论文解读:3D Object Detection三维目标检测 PV-RCNN:Point-Voxel Feature Se tAbstraction for 3D Object Det ...

  7. CVPR2020论文解读:三维语义分割3D Semantic Segmentation

    CVPR2020论文解读:三维语义分割3D Semantic Segmentation xMUDA: Cross-Modal Unsupervised Domain Adaptation for 3D ...

  8. AAAI论文首发:几何驱动的自监督的人体3D姿态估计方法

    徐亦达团队和北理工李侃老师的共同博士生李杨在AAAI 的发表了一篇机器学习论文,本人得到徐老师授权在本站发布论文. Geometry-driven Self-supervised Method for ...

  9. 3D激光SLAM:LeGO-LOAM论文解读---激光雷达里程计与建图

    3D激光SLAM:LeGO-LOAM论文解读---激光雷达里程计与建图 激光雷达里程计 针对LOAM的改进 激光雷达建图 原文 激光雷达里程计 激光雷达里程计模块的功能就是:估计相邻帧之间的位姿变换. ...

  10. 《PlaneNet-单幅RGB图像的分段平面重建》论文中英文对照解读

    论文地址:https://arxiv.org/pdf/1804.06278.pdf 代码地址:https://github.com/art-programmer/PlaneNet PlaneNet: ...

最新文章

  1. instanceOf,isInstance,Class,isAssignableFrom区别比较
  2. html语义化练习易牛课堂代码
  3. HDU - 2612 Find a way(BFS搜索)
  4. javax.naming.NameNotFoundException:
  5. centos7 nginx yum 配置
  6. CenterNet算法详解
  7. 第九周(11.02-11.08)学习笔记
  8. 基于 CODING 的 Spring Boot 持续集成项目
  9. 第三次实验及动手动脑
  10. Cocos2d-x游戏实例-《跑跑跑》制作教程(第二篇)——加入主角
  11. 植物大战僵尸修改阳光
  12. 使用命令行查看Windows系统激活信息
  13. MySQL 的主从复制原理详解高级
  14. 微信小程序canvas画布新接口type为2D时drawImage方法的使用以及注意事项
  15. Apple?apple!
  16. jude(java建模软件)_JUDE(JAVA建模软件)
  17. 一个TCP连接总是以1KB的最大段发送TCP段,发送方有足够多的数据要发送。当拥塞窗口为16KB时发生了超时,如果接下来的4个RTT(往返时间)时间内的TCP段的传输都是成功的,那么当第4个RTT时间
  18. tar 慢 加快_加快慢的Outlook 2007
  19. asp.net获取URL和IP地址
  20. NTT将在全球颇具影响力的技术盛会CES 2021上在线展出

热门文章

  1. Xcode隐藏SDK C、C++、Objective-C符号
  2. 聊聊我的2021,总结与展望
  3. HTTP headers 详解 headers 常用属性
  4. 微信小程序 —— 成员管理及开发管理
  5. 信息学奥赛一本通(c++):1125:矩阵乘法
  6. Assembler - 数据段与代码段
  7. 在项目中如何做图片优化
  8. 数学之美系列—布隆过滤器(Bloom Filter)
  9. “去中心化”到底是什么?
  10. mysql如何获取当前时间_mysql怎么获取当前时间