该文章直接预测的是平均mesh的坐标偏差,相机参数和纹理uv图。里面有各种损失函数,很值得学习。

这篇论文还有个有意思的点,论文用的训练数据是没有对应的3D模型的(也就是一张图片没有对应的3D模型)。训练过程有点像3DMM的重建过程,即先估计3D模型,将模型渲染到2D;然后比较渲染的图片和原始图片的差异,以更新模型的参数。要将这个过程应用在神经网络中,由于渲染是不可导的,因此需要解决渲染这一步骤的求导问题。这个问题的解决可以看论文:Neural 3D Mesh Renderer

上图是模型的训练过程:图片经过encoder抽取出特征,然后预测相机参数、变形参数(平均模型的顶点坐标差值,3D模型V=ΔV(差值)+V¯(平均模型)3D模型V=ΔV(差值)+V¯(平均模型)3D模型V=\Delta{V}(差值)+\bar{V}(平均模型))和纹理流;最后利用mask(前景背景掩蔽图)、特征点和纹理误差来更新网络参数。

损失函数

特征点


xixix_i 是第i个训练样本真实特征点,π̃ i(AVi)π~i(AVi)\tilde \pi_i(AV_i) 是对应的预测特征点。其中πiπi\pi_i 是相机参数。论文假设特征点可以由3D模型的其他顶点线性相加计算出来,因此有AViAViAV_i。A为一个线性方程的系数矩阵。

掩蔽

SiSiS_i 为样本i的掩蔽图,R(Vi,F,π̃ i)R(Vi,F,π~i)R(V_i,F,\tilde\pi_i) 代表利用3D mesh M=(V,F)M=(V,F)M=(V,F),F是三角面片和相机参数ππ\pi 渲染出来的掩蔽图。

相机参数

惩罚项

1、拉普拉斯网格平滑

LV是拉普拉斯网格平滑中的拉普拉斯坐标,该项的目的是使LV=0,也就是令顶点的拉普拉斯坐标等于0。几何意思是使顶点i的坐标等于其相邻顶点的均值。

2、变形参数正则化


目的是防止变形过于夸张,并且使得变形结果更有意义。

3、特征点系数矩阵约束

Lvert2kp=1|K|∑k∑v−Ak,vlogAk,vLvert2kp=1|K|∑k∑v−Ak,vlogAk,v

L_{vert2kp}=\frac{1}{|K|}\sum k \sum v-A_{k,v}logA_{k,v}

这是个交叉熵损失函数,目的是使每个特征点对应的系数AkAkA_k 应该是一个one-hot向量。

纹理

论文不是直接预测纹理图,而是预测纹理图中每个点在原始图片中的位置。3D模型中某一顶点的纹理,一般直接通过其uv坐标在纹理图中取得,论文的这个方法是先从预测出来的纹理流(矩阵)中获取x,y坐标,然后该顶点的纹理根据x,y在原始图片中得到(可以用双线性采样)。

SiSiS_i 是掩蔽图,IiIiI_i 是输入图片R(Vi,F,π̃ i,Iuv)R(Vi,F,π~i,Iuv)R(V_i,F,\tilde \pi_i,I^{uv}) 是渲染出来的图片。

上面的这个损失函数只能计算物体前面可见的纹理流,而对于3D mesh的背面就无法计算。因此作者还提出了如下损失函数:

其中G是双线性采样,DSiDSiD_{S_i} 是the distance transform field of the foreground mask(不知道啥意思。。。。),FiFiF_i 是纹理流。

3D【8】鸟类重建:Learning Category-Specific Mesh Reconstruction from Image Collections阅读笔记相关推荐

  1. MobRecon: Mobile-Friendly Hand Mesh Reconstruction from Monocular Image阅读笔记

    本文是2022CVPR的一篇文章,主要讲述的是一种基于单目图像移动友好手部网格重建,整体流程主要包含三个部分2D编码,2D到3D映射,3D解码.其中还涉及到轻量化的问题. 摘要部分介绍了本文提出的手部 ...

  2. 论文Learning to Solve Large-Scale Security-Constrained Unit Commitment Problems阅读笔记

    论文Learning to Solve Large-Scale Security-Constrained Unit Commitment Problems阅读笔记 论文arxiv链接:Learning ...

  3. Machine Learning for Encrypted Malware Traffic Classification Accounting for...阅读笔记

    Machine Learning for Encrypted Malware Traffic Classification Accounting for Noisy Lables and Non-St ...

  4. Learning to Find Good Correspondences 18‘CVPR 论文阅读笔记

    蓝色 紫色 红色 2022-01-13 22:39:19 Learning to Find Good Correspondences Code Abstract   我们开发了一个深度架构,以学习为 ...

  5. 《Learning Unsupervised Metaformer for Anomaly Detection》论文阅读笔记

    作者:Jhih-Ciang Wu1,2, Ding-Jie Chen1, Chiou-Shann Fuh2, and Tyng-Luh Liu1 出自:ICCV Abstract: 核心是一个无监督的 ...

  6. 《Deep Active Learning for Axon-Myelin Segmentation on Histology Data》--阅读笔记-Arxiv

    Active learning的核心是选择most informative的sample,这个策略是有创新型的 (https://github.com/neuropoly/deep-active-le ...

  7. [ACL22] An Imitation Learning Curriculum for Text Editing with Non-Autoregressive Models阅读笔记

    An Imitation Learning Curriculum for Text Editing with Non-Autoregressive Models [pdf] 论文状态:被ACL22接收 ...

  8. Deep Learning (Ian Goodfellow, Yoshua Bengio and Aaron Courville) 阅读笔记

    Ian Goodfellow, Yoshua Bengio and Aaron Courville 合著的<Deep Learning> 终于写完了,并且放在网上可以在线免费阅读.网址:h ...

  9. Learning Human-Object Interactions by Graph Parsing Neural Networks阅读笔记

    前言 这是一篇2018年发表在ECCV上得paper,论文原文点这里. 笔记 说实话刚看到这篇文章还是有点唬人的,文中作者提出了一个网络模型叫GPNN,图解析神经网络,我以为是跟GNN有关系,花了一些 ...

最新文章

  1. 【错误记录】Flutter 混合开发获取 BinaryMessenger 报错 ( FlutterActivityAndFragmentDelegate.getFlutterEngine() )
  2. DIV+CSS网页布局常用的一些基础知识
  3. 中央纪委网站:​深度关注 | 元宇宙如何改写人类社会生活
  4. powershell 查看系统设备\device status
  5. DMA及cache一致性的学习心得
  6. linux系统怎么设置开机密码,Linux_Linux系统怎么设置开机密码?Linux设置开机密码的方法,为了保证Linux系统的安全,应 - phpStudy...
  7. 信息学奥赛C++语言:输出学生序号与成绩
  8. 简单人物画像_天天谈【用户画像】95%的人根本不知道自己在说什么
  9. Oracle SQL性能调整注意事项
  10. 新概念英语2电子版_新概念英语读100遍,英语能超神
  11. 解决PlayerSettings中的splash Image资源发现在内存中卸载不掉
  12. c3p0 mysql 连接池配置文件_使用XML配置c3p0数据库连接池
  13. 计算机软件企业的税收,2018年软件企业增值税税收政策梳理
  14. 【论文阅读】Low-Resource Knowledge-Grounded Dialogue Generatio
  15. 文件夹访问被拒绝 你需要权限来执行此操作,您需要权限来执行此操作
  16. W ndows7系统的桌面不见了,windows7桌面音量控制键不见了怎么办(图文)
  17. Android解决监听AppBarLayout的滑动状态来动态设置标题时报requestLayout() improperly called by错误问题
  18. NEON指令优化指南学习之一
  19. android 微博字体高亮,安卓开发札记——高仿新浪微博文字处理(实现关键字高亮,自定义表情替换并加入点击事件实现)...
  20. 交接处挂网_关于本工程基层不同种材料交接处挂网范围确认事宜

热门文章

  1. STM32红外遥控实验(发射器和接收器)
  2. 用Python写了一个电子考勤系统
  3. php模拟post提交提交json数据
  4. 网络流与线性规划24题02太空飞行计划问题
  5. 移动端拍照上传到服务器
  6. Excel如何快速将多个表格合并
  7. Myth源码解析系列之二-项目结构介绍
  8. Ranger学习(一)
  9. 在当前浏览器中调试自动化脚本
  10. 电脑如何批量修改图片350dpi? 分享一款实用的在线图片处理工具