论文笔记:DeepReID: Deep Filter Pairing Neural Network for Person Re-Identification

  • 总体框架图
  • Feature extraction
  • Patch matching
  • Modeling mixture of photometric transforms
  • Modeling part displacement
  • Modeling pose and viewpoint transforms
  • Identification Recognition

这是2014年发的一篇CVPR,算是一篇很早的文章,号称“this paper is the first work to use deep learning for person re-identification”。当然,论文最后的呈现结果rank-1只有20%,而且对比算法都是传统的非深度学习算法如KISSE等。这个结果放到现在可以说是非常之low了,然而考虑到2014年的技术环境,何凯明的resnet那时还没有放出来(现在很多效果很好的re-id模型都要用到resnet做特征提取或者预训练)。所以本文作为re-id深度学习的入门文章还是可以一看的。

我们知道,流行的re-id深度学习框架主要分为两类:identification和verification。郑良在1中专门提到并对比了两种框架,并总结到identification总体上要比verification框架要好,因为verification框架并没有完全利用标注信息。但也有人不同意这种说法,2这篇文章直指郑良的说法是不准确的,并给出了verification框架中三元组损失的一种更好的改进方式。其实verification框架相对于identification框架是由天然优势的,那就是样本比identification更多,这是应用深度学习的天然优势。当然,随着数据集的不断扩大和一些数据增强手段的应用(如GAN),identification框架样本数量也不再是一个问题。

本文是一个verification框架

针对re-id问题中的photometric transforms和geometric transforms,本文分别建立了模型。具体而言,针对亮度转换,本文通过滤波器对来学习这种转换,使得两组滤波器学习到不同摄像头下图像的共同的特征。而对于几何转换,本文通过块匹配层,卷积最大池化层和全连接层来建模。

总体框架图

下面我们按照论文的顺序总结

Feature extraction

上面提到了用两组滤波器对来学习不同摄像头下的共有特征。这里我放一下原文的话来解释这个模型的作用:
Two paired filters represent the same feature most discriminative for person re-identification. They are applied to different camera views and their difference reflects the photometric transforms. The convolutional layer is followed bymax-pooling, which makes the features robust to local misalignment.


这个不难理解,通过训练过程来学习滤波器对,使他们学习到这种不同摄像头之间造成的GAP,并且关注到更有鉴别力的特征。
这里注意到通过最大池化操作将feature map大小降到H1×W1×K,来增加一些对于局部不匹配的鲁棒性。其中K为通道数。对应公式为:

Patch matching

本文将行人图片水平分为M条带,对与在同一个通道的两张feature map,各有M个水平带。本文引入了displacement matrices的概念。定义为:

由于feature map代表的是对滤波器的相应,所以当两张feature map 中同一水平带上的patch对这一通道的滤波器相应都很高时,他们的乘积就会很大。所以displacement matrices 的作用是什么呢?引入原文中的原话:These displacement matrices encode the spatial patterns of
patch matching under the different features.
总结就是编码了两张图片在不同通道的空间模式。后面的鉴别就是基于两张图片的空间模式。

到现在为止其实本文的主要模型和思想都已经阐述完了。
紧接往下看

Modeling mixture of photometric transforms

这个就非常简单了,相当于在通道的维度做了最大池化操作。这个层叫做maxout-grouping layer。

除了增加鲁棒性,这一部分还提到这种做法的一种缘由:使图像块对滤波器对有稀疏的响应(因为此时响应的维度已经低于滤波器的维度)。而稀疏往往代表着强健。

Modeling part displacement

这给也非常简单,算是一种对displacement matrices 的一种鲁棒化吧,达到放大特征视野的作用。原文的话是:obtain the displacement matrices of body parts on a larger scale。

Modeling pose and viewpoint transforms

最后就是一个全连接啦,文章也对全连接层做了物理上的解释:Such global geometric transforms can be viewed as different combinations of part displacement and their distributions are multi-modal。

Identification Recognition

这个就是我们熟悉的softmax和对应的损失函数啦。不多讲了。值得注意到的是
在这个公式中设置了a和b的学习参数。

这是我的第一篇CSDN博客,写的不好希望大家多多包涵,刚刚入门re-id。还有很多理解不到位,请大家多批评指正。


  1. Person Re-identification:Past, Present and Future ↩︎

  2. In Defense of the Triplet Loss for Person Re-Identification ↩︎

论文笔记:DeepReID: Deep Filter Pairing Neural Network for Person Re-Identification相关推荐

  1. 2014 CVPR-DeepReID Deep Filter Pairing Neural Network for Person Re-Identification

    论文地址 第一篇用深度学习来做Re-ID的工作,介绍了很多基础性的概念 model部分对CNN的设计思路讲的很详细,有些细节还没有完全搞懂,回头会继续理解总结~ Motivation 传统的re-ID ...

  2. 【论文笔记】Adaptive Reinforcement Learning Neural Network Control for Uncertain Nonlinear System

    Adaptive Reinforcement Learning Neural Network Control for Uncertain Nonlinear System With Input Sat ...

  3. 【论文笔记】A Bio-inspired Spiking Neural Network for Control of A 4-DoF Robotic Arm

    Abstract Spiking Neural Network (SNN) 尖峰神经网络 基于生物神经元的控制机制 用数据驱动的方式评估运动学特性 + 减小分析建模的复杂难度 输入:理应达到的目标位姿 ...

  4. 论文笔记:Person Re-identification with Deep Similarity-Guided Graph Neural Network

    Person Re-identification with Deep Similarity-Guided Graph Neural Network 2018-07-27 17:41:45 Paper: ...

  5. 论文笔记 《Maxout Networks》 《Network In Network》

    原文出处:http://zhangliliang.com/2014/09/22/paper-note-maxout-and-nin/ 论文笔记 <Maxout Networks> & ...

  6. 论文笔记(一):Temporal Network Embedding with High-Order Nonlinear Information

    论文笔记(一):Temporal Network Embedding with High-Order Nonlinear Information 论文标题:Temporal Network Embed ...

  7. 论文笔记:HIE-SQL:History Information Enhanced Network for Context-Dependent Text-to-SQL Semantic Parsing

    论文笔记:HIE-SQL: History Information Enhanced Network for Context-Dependent Text-to-SQL Semantic Parsin ...

  8. 【翻译论文】An Architecture Combining Convolutional Neural Network (CNN) and Support Vector Machine (SVM)

    [翻译论文]An Architecture Combining Convolutional Neural Network (CNN) and Support Vector Machine (SVM) ...

  9. 论文笔记-DEC (Deep Embedded Clustering)

    论文笔记-DEC (Deep Embedded Clustering) 知识点1.将聚类的度量参考T-SNE中的t-分布,将聚类的度量转换成一个概率值(软分配,qij 表示将样本 i 分配给 j 簇的 ...

  10. 图像隐写术分析论文笔记:Deep learning for steganalysis via convolutional neural networks

    好久没有写论文笔记了,这里开始一个新任务,即图像的steganalysis任务的深度网络模型.现在是论文阅读阶段,会陆续分享一些相关论文,以及基础知识,以及传统方法的思路,以资借鉴. 这一篇是Medi ...

最新文章

  1. OpenGL函数库详解
  2. buu Cipher
  3. 使用用户自定义类型作为map的key
  4. 不显示参数名_Houdini自定义参数Folder的几种模式
  5. Educational Codeforces Round 106 (Rated for Div. 2)
  6. 在HTML网页中使用ActiveX控件
  7. java基础基础总结----- Date
  8. [有限元]证明常应变三角形单元形函数面积分线积分公式
  9. 《算法图解》——广度优先探索与队列
  10. DDR的VTT有源端接和无源端接(slua886a笔记)
  11. 基于SDN网络的优化技术和QoS研究分析(二)
  12. 两台win10电脑连接同一个wifi怎么共享文件
  13. 利用更快的r-cnn深度学习进行目标检测
  14. 如何获取Java运行时的性能数据
  15. Samsung手机常用工程命令
  16. 科学计算机一个亿怎么显示0,一亿后面几个零
  17. 数据治理服务及数据治理应用解决方案
  18. 李亚涛:python知道长尾关键词挖掘工具
  19. 银联二维码支付与微信支付相比,哪个好用?
  20. 矩阵快速幂以及其优化【华东交大课程】

热门文章

  1. 十七、DPM模型参数设置详解
  2. MIT人工智能实验室:如何做研究
  3. 23考研需要准备哪些学习资料?
  4. 微信公众号后台添加安全域名 提示:无法访问xxx指向的web服务器(或虚拟主机)的目录,请检查网络设置
  5. Java browsing
  6. 微信小程序【网易云音乐实战】(第三篇 自定义组件、排行榜的制作、内网穿透、tabBar、个人中心)
  7. cython使用说明
  8. 基于HAL库的stm32F7串口通信
  9. 推荐 10 款让你的 Chrome 浏览器功能更强大的插件
  10. LeetCode | 665. Non-decreasing Array