Super Point 笔记(二)
Super Point 笔记-- 网络结构
接续上一篇文章,上一篇文章中已经大体介绍了Superpoint 网络的框架,本文将继续介绍superpoint内的网络部分
Super Point 结构
与其他网络结构不同,Superpoint 网络结构作用于大尺寸的完整的图片上。网络分为三部分。 1)共享的编码器。2)特征点提取解码器。3)描述子解码网络。
1)共享编码
共享编码部分使用了VGG风格的编码结构。这一部分主要是为了减少图片尺寸。编码器(encoder)包含了卷积层,pooling层以及激活函数。网络结构中的三个Max Pooling将图像尺寸从H,W降低至H/8,W/8。此时,在编码器输出的featuremap中,每一个channel代表了原图中的8x8个像素值,在文章中被称为一个cell。
2)特征点解码器
在上一部分中的encoder将HxWx1的原始图像编码为一个H/8xW/8x65维度的featuremap。65维代表这88可能的特征点的概率以及在该区域不出现特征点的垃圾桶通道(dustbin)。经过一个channel维度的softmax操作后,dustbin通道被去除变成了H/8xW/864的featuremap,最后将其reshape变成HW维度。
3)描述符解码器
描述符解码器将输出一个HxWxD维度的featuremap。个人理解,此处就是对应了图片HW维度上的每一个点,并对图片上的点进行描述,文中的
D为256。
Loss函数
本文中的loss函数如下
L(X,X′,D,D′;Y,Y′,S)=Lp(X,Y)+Lp(X′,Y′)+λLd(D,D′,S).\ L(X,X^{'} ,D,D^{'};Y,Y^{'},S)=L_{p}(X,Y)+L_{p}(X^{'},Y^{'})+\lambda L_{d}(D,D^{'},S). L(X,X′,D,D′;Y,Y′,S)=Lp(X,Y)+Lp(X′,Y′)+λLd(D,D′,S).
本文中的loss函数分为两个部分,Lp\ L_{p} Lp 表示为特征点loss,Ld\ L_{d} Ld表示为描述符的loss函数。
特征点检测的loss函数 Lp\ L_{p} Lp是一个交叉熵loss。
Lp(X,Y)=1HcWc∑h=1,w=1Hc,Wclp(xhw;yhw)\ L_{p}(X,Y)= \frac{1}{H_{c}W_{c}} \sum_{h=1,w=1}^{H_{c},W_{c}} l_{p}(x_{hw};y_{hw}) Lp(X,Y)=HcWc1∑h=1,w=1Hc,Wclp(xhw;yhw)
在这里面lp(xhw;y)=−logexp(xhwy)∑k=165exp(xhwk)\ l_p(x_{hw};y) =-log \frac{exp(x_{hwy})}{\sum_{k=1}^{65} exp(x_{hwk})} lp(xhw;y)=−log∑k=165exp(xhwk)exp(xhwy)
在Lp\ L_p Lp中,相当于对64个channel中和y的真值位置做了一个交叉熵函数。这样将会找到64个通道中的特征点的位置,并映射回HW上。
描述符的Loss
未完待续
Super Point 笔记(二)相关推荐
- PyTorch学习笔记(二)——回归
PyTorch学习笔记(二)--回归 本文主要是用PyTorch来实现一个简单的回归任务. 编辑器:spyder 1.引入相应的包及生成伪数据 import torch import torch.nn ...
- ES6学习笔记二arrow functions 箭头函数、template string、destructuring
接着上一篇的说. arrow functions 箭头函数 => 更便捷的函数声明 document.getElementById("click_1").onclick = ...
- Java语言基础(Java自我进阶笔记二)
Java语言基础(Java自我进阶笔记二) 一. 什么是Java 的主类结构? 1. #mermaid-svg-xWTL2A8kDyyRPexH .label{font-family:'trebuch ...
- java面试笔记二:java的面向对象
java面试笔记二:面向对象 面向对象和面向过程的区别 过程就是函数,就是写方法,就是方法的一种实现. 对象就是将函数,属性的一种封装.用人们思考习惯的方式思考问题. 匿名对象 即:创建对象时没有指定 ...
- SpringCloud 2020笔记二
SpringCloud 2020笔记二 Spring Cloud 2020 笔记一 五.GateWay Spring生态系统之上建立的 API 网关服务 基于Spring FrameWork 5.Pr ...
- qml学习笔记(二):可视化元素基类Item详解(上半场anchors等等)
原博主博客地址:http://blog.csdn.net/qq21497936 本文章博客地址:http://blog.csdn.net/qq21497936/article/details/7851 ...
- oracle直查和call哪个更快,让oracle跑的更快1读书笔记二
当前位置:我的异常网» 数据库 » <>读书笔记二 <>读书笔记二 www.myexceptions.net 网友分享于:2013-08-23 浏览:9次 <> ...
- 【Visual C++】游戏开发笔记二十七 Direct3D 11入门级知识介绍
游戏开发笔记二十七 Direct3D 11入门级知识介绍 作者:毛星云 邮箱: happylifemxy@163.com 期待着与志同道合的朋友们相互交流 上一节里我们介绍了在迈入Dire ...
- [转载]dorado学习笔记(二)
原文地址:dorado学习笔记(二)作者:傻掛 ·isFirst, isLast在什么情况下使用?在遍历dataset的时候会用到 ·dorado执行的顺序,首先由jsp发送请求,调用相关的ViewM ...
最新文章
- perl 分析mysql binlog
- software on macbook pro
- sphinx数据文件简析
- 数字滚动_告别单调!让PPT数字滚动起来。
- 2015-04-11一些知识点
- java构建学生对象布尔类型,Java如何将原始布尔类型转换为布尔对象?
- tensorflow之视频质量诊断
- vtiger 安装中文语言包(汉化的步骤)--拓展繁体中文
- HTML5与Flash相比有哪些好处?
- 批量下载微软官网上的桌面壁纸图片
- pyspider 爬取淘宝食品
- 浏览器有网微信没网络连接服务器,电脑可以登陆微信但是浏览器无法联网是怎么回事儿...
- android通过代码设置铃声_更接地气的定制 ROM,还有哪些特性可以向原生 Android 借鉴?
- 复合材料计算机模拟的组成,关于复合材料层合板结构力学性能数值仿真架构的讨论...
- 新绝代双骄三 (张菁、何露)完美全攻略
- 算法时代必读——《算法霸权》数学杀伤性武器的威胁
- 实现用友U8+与旺店通ERP数据同步
- android培训感想
- 阿里云合作伙伴查询合作流程
- Bootstrap+JSP+MySQL搭建电商网站
热门文章
- java.time.DateTimeException: Unable to extract ZoneId from temporal
- 求帮忙,给python中安装matplotlib系统里有但是显示不出来,万分感谢啊大家
- 景区电商平台网站建设方案
- 数据结构与算法(python):图(Graph)的基本概念及应用
- 二手交易网站 /二手交易平台/二手交易系统
- 微信哪个电话能转人工服务器,如何联系微信人工客服?掌握好窍门,只需30秒可接通,亲测有效...
- CSV文件格式——方便好用个头最小的数据传递方式
- 开源·共享·创新|2020年中国.NET开发者大会圆满收官!
- python定时发微信消息给心爱的她
- 《倾城·魅影——CG奇幻插画及技法赏析》—神咒