《SketchMate:面向百万级人类草图检索的深度哈希算法》论文阅读笔记

写在前面:水平有限,此笔记仅在本人有限的理解水平上完成,有错误希望读者批评指正。
论文和代码见网址:https://paperswithcode.com/paper/sketchmate-deep-hashing-for-million-scale

本文首次提出了一个用于草图检索的深度哈希框架,来适配数百万级别的尺度的人体草图数据集。与传统的草图识别任务不同,本文引入了草图哈希检索的新问题,不仅更具挑战性,而且为大规模草图分析提供了更好的实验平台:1、需要更细粒度的草图特征学习,以适应风格和抽象的巨大变化,2、一个紧凑的二进制代码需要学习的同时,以使有效的检索。
本文1、采用两分支CNN-RNN结构来探索笔画的时间顺序,2、专门设计了一种新的散列损失来适应的时间和抽象特征的草图。

本文的主要贡献有三个:
1、首次在一个数百万尺度的人体草图数据集上引入草图哈希检索问题,并提出一种直接适应人体草图关键特征的深度哈希网络。
2、提出了一种新的多分支CNN-RNN结构,它专门编码草图的时序信息,以学习更细粒度的特征表示。
3、设计了一种新的散列损失以适应草图的抽象性质,特别是在噪声也存在的大数据集上。

本文提出的双分支CNN_RNN模型如下图:

如上所示,该模型由三个子模块构成:
1、CNN编码器接受光栅像素素描并转换到一个高维空间;
2、RNN编码器接受矢量草图和输出其最后的时间步长状态
3、两分支最后在一个后期融合层融合

首次提出了 草图中心损失:
1、首先分别对CNN-RNN进行草图识别的预训练,然后利用我们的完整模型进行微调,两者都只考虑softmax交叉熵损失
2、基于预训练的模型,对该类的去噪草图,通过计算散列特征fn的均值,得到类特征中心Cyn。
3、草图中心损失定义为:

通过这样做,在最后的微调阶段,为每个类使用固定的中心进行端到端训练,从而在每次训练迭代中提供有意义的梯度,根据经验发现,在这种特定于草图的中心损失下,性能有显著提升。

本文提出的 基于多阶段预训练的深度草图哈希模型算法 如下:

其中,K代表N个可能跨越L个类别的样本对,每个样本对包含光栅像素空间的草图Pn和相应的草图段序列Sn,y是他们各自的标签,
用到的损失如下:

K的L way softmax交叉熵损失Lcel:

Wj是量化编码层与L way softmax输出之间的权值W的第j列,bj_hat是偏差b_hat的第j项。

草图中心损失Lscl,上面已经介绍过了。

全部损失Lfull:

其中的两个系数,用来控制相应损失的相对重要性
Lqt为量化损失

fn为图片的哈希特征,bn为图片的哈希码。

【论文笔记】《SketchMate: Deep Hashing for Million-Scale Human Sketch Retrieval》相关推荐

  1. 论文笔记之Understanding and Diagnosing Visual Tracking Systems

    Understanding and Diagnosing Visual Tracking Systems 论文链接:http://dwz.cn/6qPeIb 本文的主要思想是为了剖析出一个跟踪算法中到 ...

  2. 《Understanding and Diagnosing Visual Tracking Systems》论文笔记

    本人为目标追踪初入小白,在博客下第一次记录一下自己的论文笔记,如有差错,恳请批评指正!! 论文相关信息:<Understanding and Diagnosing Visual Tracking ...

  3. 论文笔记Understanding and Diagnosing Visual Tracking Systems

    最近在看目标跟踪方面的论文,看到王乃岩博士发的一篇分析跟踪系统的文章,将目标跟踪系统拆分为多个独立的部分进行分析,比较各个部分的效果.本文主要对该论文的重点的一个大致翻译,刚入门,水平有限,如有理解错 ...

  4. 目标跟踪笔记Understanding and Diagnosing Visual Tracking Systems

    Understanding and Diagnosing Visual Tracking Systems 原文链接:https://blog.csdn.net/u010515206/article/d ...

  5. 追踪系统分模块解析(Understanding and Diagnosing Visual Tracking Systems)

    追踪系统分模块解析(Understanding and Diagnosing Visual Tracking Systems) PROJECT http://winsty.net/tracker_di ...

  6. ICCV 2015 《Understanding and Diagnosing Visual Tracking Systems》论文笔记

    目录 写在前面 文章大意 一些benchmark 实验 实验设置 基本模型 数据集 实验1 Featrue Extractor 实验2 Observation Model 实验3 Motion Mod ...

  7. Understanding and Diagnosing Visual Tracking Systems

    文章把一个跟踪器分为几个模块,分别为motion model, feature extractor, observation model, model updater, and ensemble po ...

  8. CVPR 2017 SANet:《SANet: Structure-Aware Network for Visual Tracking》论文笔记

    理解出错之处望不吝指正. 本文模型叫做SANet.作者在论文中提到,CNN模型主要适用于类间判别,对于相似物体的判别能力不强.作者提出使用RNN对目标物体的self-structure进行建模,用于提 ...

  9. ICCV 2017 UCT:《UCT: Learning Unified Convolutional Networks forReal-time Visual Tracking》论文笔记

    理解出错之处望不吝指正. 本文模型叫做UCT.就像论文题目一样,作者提出了一个基于卷积神经网络的end2end的tracking模型.模型的整体结构如下图所示(图中实线代表online trackin ...

  10. CVPR 2018 STRCF:《Learning Spatial-Temporal Regularized Correlation Filters for Visual Tracking》论文笔记

    理解出错之处望不吝指正. 本文提出的模型叫做STRCF. 在DCF中存在边界效应,SRDCF在DCF的基础上中通过加入spatial惩罚项解决了边界效应,但是SRDCF在tracking的过程中要使用 ...

最新文章

  1. colab加载google drive并且调试时跳过不运行
  2. [Hei-Ocelot-Gateway ].Net Core Api网关Ocelot的开箱即用版本
  3. python3 爬虫第二步Selenium 使用简单的方式抓取复杂的页面信息
  4. 玩转oracle 11g(39):oracle11g密码过期后的解决方法
  5. Oracle 表备份还原
  6. 深入理解Angular2变化监测和ngZone
  7. 【常用传感器】DS18B20温度传感器原理详解及例程代码
  8. matlab矩阵排序sort,MATLAB数组元素的排序
  9. html中button标签reset用法
  10. Power Platform 零基础 Power Apps canvas+Power Automate 画布应用基础搭建应用流程
  11. python输入矩阵_python矩阵输入
  12. 数据中心白皮书 2022东数西算下数据中心高性能计算的六大趋势八大技术
  13. UVM中的factory机制
  14. 2017年计算机二级考试的word的答案,2017年3月全国计算机考试等级考试二级《MS Office高级应用》真题及答案...
  15. js拖拽图片到浏览器上传
  16. 自旋锁以及Java中的自旋锁的实现
  17. CE-扫描扫雷中雷区地址
  18. 针对严峻的网络安全环境,公司就当如何应对?
  19. 什么是发布非约定商品?发布非约定商品的处罚是什么?
  20. Spring中IoC和DI的理解

热门文章

  1. matlab神经网络应用设计,神经网络及其matlab实现
  2. shortcut详解
  3. 老沙电信级项目教程-权限部分(1)
  4. 人事管理系统是什么?HR系统有什么用?
  5. APP——功耗测试(耗电测试)——adb命令简单获取分析
  6. 后缀是lnk是什么文件_后缀为.lnk的文件怎么打开?
  7. 删除dataframe中的某行 删除不掉是为啥
  8. 操作系统发展历程 (Unix、Linux、windows)
  9. SQL Server2019配置管理器无法连接到 WMI 提供程序
  10. couchbase_Couchbase评论:智能NoSQL数据库