sfm-learner学习心得
一、 sfm-learner
A、sfm-learner核心运行流程图如下图所示
核心:Depth CNN和Pose CNN
具体过程:
1、目标视图作为Depth CNN的输入生成具有每个像素深度的深度图,即Dt^Dt^\hat{D_t} ;
2、对于Pose CNN则将目标视图和源视图作为输入,输出相机的相对姿态T^t→t−1T^t→t−1\hat{T}_{t\rightarrow t-1},T^t→t+1T^t→t+1\hat{T}_{t\rightarrow t+1};
3、Depth CNN和Pose CNN的输出,即Dt^Dt^\hat{D_t} 和T^t→t−1T^t→t−1\hat{T}_{t\rightarrow t-1},T^t→t+1T^t→t+1\hat{T}_{t\rightarrow t+1};用来逆向翘曲(wrap)源视图以生成目标视图。
4、利用复原图与目标视图之间的误差用于训练Depth CNN和Pose CNN,至此我们可以无监督的训练我们的神经网络。
即Lvs=∑s∑p|It(p)−I^s(p)|Lvs=∑s∑p|It(p)−I^s(p)|L_{vs} = \sum_s\sum_p|I_t(p)-\hat{I}_s(p)|
B、Illustration of the differentiable image warping process.
可微深度图像渲染
对于目标视图上的每一点PtPtP_t,首先利用预测的深度和相机姿态将它们映射(project)到源视图上,然后利用双线性插值得到翘曲图像在PtPtP_t处的值。
p_s - K\hat{T}_{t\rightarrow s}\hat{D}_t(p_t)K^{-1}p_t
其中 PsPsP_s是连续的,可以利用双微边采样,线性插值 PsPsP_s四个相邻像素的值来近似 Is(Ps)Is(Ps)I_s(P_s)、用一个 ωijωij\omega^{ij}表示线性插值,此处通过投影几何学得到的像素warping的坐标能够充分利用估计的深度和估计的相机姿态。
建模的限制
基于三个假设:
- 场景是静态的
- 源视图与目标视图之间没有遮挡
- 表面是理想镜面反射,这样图像的一次性误差才有意义。
对目标视图的每个像素添加置信系数E^sE^s\hat{E}_s得到:
Lvs=∑s∑pE^s(p)|It(p)−I^s(p)|Lvs=∑s∑pE^s(p)|It(p)−I^s(p)|L_{vs} = \sum_s\sum_p \hat{E}_s(p)|I_t(p)-\hat{I}_s(p)|
克服梯度的局限性
模型的梯度主要来源于I(pt)I(pt)I(p_t)与其相邻的四个I(pt)I(pt)I(p_t),如果pspsp_s位于一个缺少纹理的区域或者当前的估计不够准确。解决策略:
1、利用网络结构约束输出平滑,是的梯度从有意义的区域传输到邻近的区域;
2、明确多尺度与平滑损失:允许梯度能直接从更大的空间区域得到。通过将第二种思路应用到该工作中,用为他对网络结构框架不敏感,预测深度图时,我们通过最小化二阶梯度的L1L1L_1范数来得到。最后的损失函数:
二、 sfm-Net
一对帧作为输入,我们的模型将帧与帧之间的像素运动分解到三维场景深度,三维相机旋转,平移
sfm-learner学习心得相关推荐
- Java EE学习心得
–Java EE学习心得 1. 称为编程专家的秘诀是: 思考-----编程--------思考------编程--.. 编程不能一步到位,不能一上来就编,必须先思考如何写,怎样写?然后再编程 ...
- Assembly学习心得
http://blog.csdn.net/etmonitor/ Assembly学习心得 说明: 最近开始准备把学到的.NET知识重新整理一遍,眼过千遍不如手过一遍,所以我准备记下我的学习心得,已备参 ...
- 对于mysql存储过程感想_存储过程学习心得
存储过程学习心得 (2014-12-28 17:28:06) 标签: it 我使用过几次SQL Server,但所有与数据库的交互都是通过应用程序的编码来实现的.我不知到在哪里使用存储过程,也不了解实 ...
- 好程序员Web前端教程分享Vue学习心得
为什么80%的码农都做不了架构师?>>> 好程序员Web前端教程分享Vue学习心得,Vue是一套用于构建用户界面的渐进式框架.与其它大型框架不同的是,Vue 被设计为可以自底向 ...
- 大学计算机课英语心得体会,关于计算机网络辅助大学英语教学的思考学习心得...
关于计算机网络辅助大学英语教学的思考学习心得 [摘要]计算机网络辅助教学可以增强学生的学习兴趣,提高他们自觉学习的能力,因而得到了大多数学生的认可,取得了比较显著的成效.计算机网络辅助教学也对大学英语 ...
- 我的MYSQL学习心得(十六) 优化
原文:我的MYSQL学习心得(十六) 优化 我的MYSQL学习心得(十六) 优化 我的MYSQL学习心得(一) 简单语法 我的MYSQL学习心得(二) 数据类型宽度 我的MYSQL学习心得(三) 查看 ...
- Spring Framework------version4.3.5-----Reference学习心得-----总结
1.Spring Framework概述: 有很多可用版本,网址http://projects.spring.io/spring-framework/ 2.Spring Framework ...
- 计算机基础与应用(上)笔记总结,计算机基础学习心得体会范文(通用3篇)
计算机基础学习心得体会范文(通用3篇) 当我们对人生或者事物有了新的思考时,好好地写一份心得体会,这样可以记录我们的思想活动.那么要如何写呢?以下是小编精心整理的计算机基础学习心得体会范文(通用3篇) ...
- *:学习心得——C语言----S1T62班 王作舟
*:学习心得--C语言----S1T62班 王作舟 来源:[url]http://www.accp-teem.com.cn/ArticleView/2007-7-14/Article_View_118 ...
- [转]verilog语法学习心得
verilog语法学习心得 1.数字电路基础知识: 布尔代数.门级电路的内部晶体管结构.组合逻辑电路分析与设计.触发器.时序逻辑电路分析与设计 2.数字系统的构成: 传感器 AD 数字处理器 D ...
最新文章
- 此域的推荐安全级别是“安全级-高”的解决办法
- ant基本标签 及import properties
- [leetcode]347. Top K Frequent Elements
- etl构建数据仓库五步法_带你了解数据仓库的基本架构
- 开发者必看:iOS应用审核的通关秘籍
- Linux开机启动过程(2):内核启动的第一步
- 详解CSS position属性
- 机器学习第六回-无监督学习—— K-均值算法
- 如何对大数据进行分析
- HTML5_2(视频)
- 个人CTF入门训练过程WriteUp
- html回到上一步,【答疑】Photoshop返回上一步和下一步快捷键是什么? - 视频教程线上学...
- 将数组分成两部分,使得这两部分的和的差最小
- 任意大小icon图标制作方法
- 计算机网卡更改mac地址,Mac电脑网卡MAC地址修改的具体步骤
- 数学建模之:匈牙利算法python代码
- 【java初学】面向对象继承
- 游戏美术设计从业者过了30岁后都是如何发展的?
- 【Codeforces 891 E】 Lust(生成函数)
- python测试开发django-122.bootstrap模态框(modal)学习
热门文章
- 内存模型系列(下)- 内存持久性模型(Memory Persistency)
- python土味情话_GitHub - MMstarry/itchat: 微信机器人 土味情话
- MBTI职业性格测试(Psytopic特别版)
- Mocha.js官方文档翻译 —— 简单、灵活、有趣
- 海洋cms index.php被修改,海洋CMS(SEACMS)新版本V6.55补丁仍可被绕过执行任意代码...
- 档案重要吗有什么作用(转载记录避免以后麻烦)
- 扩展欧几里得___追风少年的坐骑(2016swust信息院赛)
- APP合规讲堂(七)-App有关收集使用规则的内容晦涩难懂、冗长繁琐,用户难以理解
- 关于find_busiest_group函数提现出的Linux性能问题
- 怎么避免从删库到跑路