目录

  • [1] PIFuHD: Multi-Level Pixel-Aligned Implicit Function for High-Resolution 3D Human Digitization
  • [2] Height and Uprightness Invariance for 3D Prediction from a Single View
  • [3] RoutedFusion: Learning Real-time Depth Map Fusion
  • [4] Information-Driven Direct RGB-D Odometry
  • [5] Anisotropic Convolutional Networks for 3D Semantic Scene Completion
  • [6] Total3DUnderstanding: Joint Layout, Object Pose and Mesh Reconstruction for Indoor Scenes from a Single Image
  • 总结

[1] PIFuHD: Multi-Level Pixel-Aligned Implicit Function for High-Resolution 3D Human Digitization

  • 出自南加大的一个系列工作
  • task:基于图片的三维重建
  • motivation:重建的表面不够细节,不够精致,high-fidelity + accuracy + high resolution
  • high-fidelity:Pixel-Aligned Implicit Funciton(ICCV 2019,简称PIFu)。
  • 得到high-fidelity的重建后,如何得到accuracy + high resolution?使用双分支结构,上分支对原图进行下采样,使用Coarse PIFu进行处理;下分支先预测前后双向的表面法向量结构,使用Fine PIFu进行处理。然后,采样空间中的一个点,在低分和高分向量中找到local向量,过MLP后判断是否在表面上。

[2] Height and Uprightness Invariance for 3D Prediction from a Single View

  • task:单视角三维重建
  • motivation:已有方法忽略了一个问题——不同相机位姿下物体高度是不变的。解决data conflict问题——两张图片能对应到同一个点,但是它们的label对不上。eg:跟踪同一个视频中的两个物体,跟踪物体1时,物体2是负样本,跟踪物体2时,物体2是正样本。
  • method:检测地平面,计算相机高度,对坐标进行变换。

[3] RoutedFusion: Learning Real-time Depth Map Fusion

  • task:输入:位姿、RGB-D图像,输出:融合后的完整的3D场景。
  • background: TSDF。
  • motivation:文中在Introduction中列出了3个优点、6个缺点。①. TSDF采用加权更新,具有一定限制。②. TSDF的更新是线性的,截断值t是预设的,会产生伪影。③. 融合可能会把正反平面抵消。④. 噪声无法处理。⑤. 无法处理gross outliers。⑥. 存在超参,对于特定的场景需要进行调整。
  • method:通过降噪和异常处理(自编码器)解决④⑤,通过refine解决②。其实就是都交给网络去学。
  • 本文方法不是端到端的。

[4] Information-Driven Direct RGB-D Odometry

  • task:基于RGB-D的视觉里程计。
  • related works:特征点法、直接法。
  • contribution:第一个引入信息理论的方法,在每个模块(小节)中都引入了信息理论,在每个小节中都有motivation。
  • 本文在BA(Bundle Adjustment)凸优化的基础上,针对计算效率进行优化。

[5] Anisotropic Convolutional Networks for 3D Semantic Scene Completion

  • task:从静态深度图或RGB图像感知三维世界。
  • motivation:现有方法存在两个问题:①. 三维卷积的感受野固定,不能迎合物体的变化。②. 三维卷积是计算密集型,消耗较大。后有方法解决了第二个问题,本文主要针对第一个问题。
  • method:提出AIC模块,不使用固定大小卷积核,学习卷积核的大小,形成不同的感受野。

[6] Total3DUnderstanding: Joint Layout, Object Pose and Mesh Reconstruction for Indoor Scenes from a Single Image

  • task:室内场景语义重建。
  • motivation:在场景理解和物体网格重建之间架起桥梁。
  • contribution:①. 本文是第一个端到端的、在实例等级上使用网格重构的3D场景理解方法。②. 在对象网格生成中,提出一种新的密度感知拓扑修改器。③. 本文方法考虑了对象之间的attention机制和多边关系。

总结

  • [1]中通过重建front/back normal来增加细节信息,V&L中能通过什么增加细节信息呢?
  • 使用信息论做决策,如何能套到V&L中?可否替代一些强化学习的决策方法?

2020-07-07 CVPR2020 i3DV论文讨论(3) 笔记相关推荐

  1. 2020-07-14 CVPR2020 i3DV论文讨论(4) 笔记

    目录 [1] MARMVS: Matching Ambiguity Reduced Multiple View Stereo for Efficient Large Scale Scene Recon ...

  2. 2020-07-03 CVPR2020 i3DV论文讨论(2) 笔记

    目录 [1] Context Prior for Scene Segmentation [2] Deep Stereo using Adaptive Thin Volume Representatio ...

  3. 2020-06-18 CVPR2020 VL论文讨论(1) 笔记

    目录 CC J JY S [1] Normalized and Geometry-Aware Self-Attention Network for Image Captioning [2] Cops- ...

  4. 2020-07-16 CVPR2020 VL论文讨论(5) 笔记

    目录 [1] SQuINTing at VQA Models: Introspecting VQA Models with Sub-Questions [2] Iterative Answer Pre ...

  5. 2020-07-09 CVPR2020 VL论文讨论(4) 笔记

    目录 [1] Embodied Language Grounding with 3D Visual Feature Representations [2] Where Does It Exist: S ...

  6. 2020-07-02 CVPR2020 VL论文讨论(3) 笔记

    目录 [1] Bi-directional Relationship Inferring Network for Referring Image Segmentation [2] A Real-Tim ...

  7. 【2020】07 留校

    目录 系列文章 7月 5 9 10 11 12 15 17 18 19 20 22 24 25 26 27 28 29 30 31 系列文章 [2020]02 记录生活 [2020]03 从中二走向理 ...

  8. 【CVPR 2020】CVPR2020 最新论文下载!看计算机视觉2020在研究什么?

    公众号关注 "视学算法" 设为 "星标",DLCV消息即可送达! 本文由极市平台整理 最近计算机视觉三大顶会之一CVPR2020接收结果已经公布,一共有1470 ...

  9. CVPR2020最新论文扫描盘点(下)

    CVPR2020最新论文扫描盘点(下) 最近计算机视觉三大顶会之一CVPR2020接收结果已经公布,一共有1470篇论文被接收,接收率为22%,相比去年降低3个百分点,竞争越来越激烈.这里整理来自Tw ...

最新文章

  1. 使用acs-engine在Azure中国区部署kubernetes集群详解
  2. ANDROID 获得地理位置
  3. 语音学习笔记3------matlab实现傅里叶反变换ifft()函数
  4. 流量渠道 转化率 买家行为 处罚扣分规则 如何不被抓单,被判虚假交易对店铺的影响
  5. [Android]之一:Android系统下载管理DownloadManager
  6. Codeforces869C The Intriguing Obsession
  7. 作业1:C#使用委托实现信用卡用户定时还款功能
  8. 05_JUC强大的辅助类
  9. IP-guard功能详解—即时通讯监控
  10. 孩子,我想当富豪的妈妈---一位犹太妈妈的金钱观
  11. 广东中小学招聘计算机教师,广州25所中小学招聘编内教师:88%的学校仅招硕士或博士...
  12. java加锁与同步方法
  13. 最小生成树之Prim(普里姆)算法
  14. 解决华为手机不能用USB链接电脑的问题
  15. Lattice Diamond与modelsim联合仿真环境设置
  16. niginx参数配置详解(转)
  17. 初征——智能化商品采集功能助力高效运营店铺
  18. 拉链表的详细实现过程(好文点赞收藏!!)
  19. 【财务】FMS财务管理系统---日常数据核对与处理
  20. 项目经理:不要再使用Double类型去进行金额计算啦

热门文章

  1. [云炬创业基础笔记]第六章商业模式测试17
  2. 云炬创业政策学习笔记20210104
  3. [快速入门MATLAB]MATLAB常见问题及解答汇总
  4. Coursera吴恩达《优化深度神经网络》课程笔记(1)-- 深度学习的实用层面
  5. mysql 全表连接_MySQL学习—多表查询(内连接,外链接,全连接)
  6. 系统间通信2:通信管理与远程方法调用RMI
  7. VS2010中使用正则表达式替换时无法使用回车符的解决方法
  8. 如何将本地代码上传到GitHub
  9. MPU6050开发 -- 初识
  10. zcmu2014(公式推导+二分)