Super Point 笔记-- 网络结构

接续上一篇文章,上一篇文章中已经大体介绍了Superpoint 网络的框架,本文将继续介绍superpoint内的网络部分

Super Point 结构

与其他网络结构不同,Superpoint 网络结构作用于大尺寸的完整的图片上。网络分为三部分。 1)共享的编码器。2)特征点提取解码器。3)描述子解码网络。

1)共享编码
共享编码部分使用了VGG风格的编码结构。这一部分主要是为了减少图片尺寸。编码器(encoder)包含了卷积层,pooling层以及激活函数。网络结构中的三个Max Pooling将图像尺寸从H,W降低至H/8,W/8。此时,在编码器输出的featuremap中,每一个channel代表了原图中的8x8个像素值,在文章中被称为一个cell。
2)特征点解码器
在上一部分中的encoder将HxWx1的原始图像编码为一个H/8xW/8x65维度的featuremap。65维代表这88可能的特征点的概率以及在该区域不出现特征点的垃圾桶通道(dustbin)。经过一个channel维度的softmax操作后,dustbin通道被去除变成了H/8xW/864的featuremap,最后将其reshape变成HW维度。
3)描述符解码器
描述符解码器将输出一个HxWxD维度的featuremap。个人理解,此处就是对应了图片H
W维度上的每一个点,并对图片上的点进行描述,文中的
D为256。

Loss函数

本文中的loss函数如下
L(X,X′,D,D′;Y,Y′,S)=Lp(X,Y)+Lp(X′,Y′)+λLd(D,D′,S).\ L(X,X^{'} ,D,D^{'};Y,Y^{'},S)=L_{p}(X,Y)+L_{p}(X^{'},Y^{'})+\lambda L_{d}(D,D^{'},S). L(X,X′,D,D′;Y,Y′,S)=Lp​(X,Y)+Lp​(X′,Y′)+λLd​(D,D′,S).
本文中的loss函数分为两个部分,Lp\ L_{p} Lp​ 表示为特征点loss,Ld\ L_{d} Ld​表示为描述符的loss函数。
特征点检测的loss函数 Lp\ L_{p} Lp​是一个交叉熵loss。
Lp(X,Y)=1HcWc∑h=1,w=1Hc,Wclp(xhw;yhw)\ L_{p}(X,Y)= \frac{1}{H_{c}W_{c}} \sum_{h=1,w=1}^{H_{c},W_{c}} l_{p}(x_{hw};y_{hw}) Lp​(X,Y)=Hc​Wc​1​∑h=1,w=1Hc​,Wc​​lp​(xhw​;yhw​)
在这里面lp(xhw;y)=−logexp(xhwy)∑k=165exp(xhwk)\ l_p(x_{hw};y) =-log \frac{exp(x_{hwy})}{\sum_{k=1}^{65} exp(x_{hwk})} lp​(xhw​;y)=−log∑k=165​exp(xhwk​)exp(xhwy​)​
在Lp\ L_p Lp​中,相当于对64个channel中和y的真值位置做了一个交叉熵函数。这样将会找到64个通道中的特征点的位置,并映射回HW上。

描述符的Loss

未完待续

Super Point 笔记(二)相关推荐

  1. PyTorch学习笔记(二)——回归

    PyTorch学习笔记(二)--回归 本文主要是用PyTorch来实现一个简单的回归任务. 编辑器:spyder 1.引入相应的包及生成伪数据 import torch import torch.nn ...

  2. ES6学习笔记二arrow functions 箭头函数、template string、destructuring

    接着上一篇的说. arrow functions 箭头函数 => 更便捷的函数声明 document.getElementById("click_1").onclick = ...

  3. Java语言基础(Java自我进阶笔记二)

    Java语言基础(Java自我进阶笔记二) 一. 什么是Java 的主类结构? 1. #mermaid-svg-xWTL2A8kDyyRPexH .label{font-family:'trebuch ...

  4. java面试笔记二:java的面向对象

    java面试笔记二:面向对象 面向对象和面向过程的区别 过程就是函数,就是写方法,就是方法的一种实现. 对象就是将函数,属性的一种封装.用人们思考习惯的方式思考问题. 匿名对象 即:创建对象时没有指定 ...

  5. SpringCloud 2020笔记二

    SpringCloud 2020笔记二 Spring Cloud 2020 笔记一 五.GateWay Spring生态系统之上建立的 API 网关服务 基于Spring FrameWork 5.Pr ...

  6. qml学习笔记(二):可视化元素基类Item详解(上半场anchors等等)

    原博主博客地址:http://blog.csdn.net/qq21497936 本文章博客地址:http://blog.csdn.net/qq21497936/article/details/7851 ...

  7. oracle直查和call哪个更快,让oracle跑的更快1读书笔记二

    当前位置:我的异常网» 数据库 » <>读书笔记二 <>读书笔记二 www.myexceptions.net  网友分享于:2013-08-23  浏览:9次 <> ...

  8. 【Visual C++】游戏开发笔记二十七 Direct3D 11入门级知识介绍

    游戏开发笔记二十七 Direct3D 11入门级知识介绍 作者:毛星云    邮箱: happylifemxy@163.com    期待着与志同道合的朋友们相互交流 上一节里我们介绍了在迈入Dire ...

  9. [转载]dorado学习笔记(二)

    原文地址:dorado学习笔记(二)作者:傻掛 ·isFirst, isLast在什么情况下使用?在遍历dataset的时候会用到 ·dorado执行的顺序,首先由jsp发送请求,调用相关的ViewM ...

最新文章

  1. perl 分析mysql binlog
  2. software on macbook pro
  3. sphinx数据文件简析
  4. 数字滚动_告别单调!让PPT数字滚动起来。
  5. 2015-04-11一些知识点
  6. java构建学生对象布尔类型,Java如何将原始布尔类型转换为布尔对象?
  7. tensorflow之视频质量诊断
  8. vtiger 安装中文语言包(汉化的步骤)--拓展繁体中文
  9. HTML5与Flash相比有哪些好处?
  10. 批量下载微软官网上的桌面壁纸图片
  11. pyspider 爬取淘宝食品
  12. 浏览器有网微信没网络连接服务器,电脑可以登陆微信但是浏览器无法联网是怎么回事儿...
  13. android通过代码设置铃声_更接地气的定制 ROM,还有哪些特性可以向原生 Android 借鉴?
  14. 复合材料计算机模拟的组成,关于复合材料层合板结构力学性能数值仿真架构的讨论...
  15. 新绝代双骄三 (张菁、何露)完美全攻略
  16. 算法时代必读——《算法霸权》数学杀伤性武器的威胁
  17. 实现用友U8+与旺店通ERP数据同步
  18. android培训感想
  19. 阿里云合作伙伴查询合作流程
  20. Bootstrap+JSP+MySQL搭建电商网站

热门文章

  1. java.time.DateTimeException: Unable to extract ZoneId from temporal
  2. 求帮忙,给python中安装matplotlib系统里有但是显示不出来,万分感谢啊大家
  3. 景区电商平台网站建设方案
  4. 数据结构与算法(python):图(Graph)的基本概念及应用
  5. 二手交易网站 /二手交易平台/二手交易系统
  6. 微信哪个电话能转人工服务器,如何联系微信人工客服?掌握好窍门,只需30秒可接通,亲测有效...
  7. CSV文件格式——方便好用个头最小的数据传递方式
  8. 开源·共享·创新|2020年中国.NET开发者大会圆满收官!
  9. python定时发微信消息给心爱的她
  10. 《倾城·魅影——CG奇幻插画及技法赏析》—神咒