一 各种方法性能比较

Method Key Market  r1 Market mAP Duke r1 Duke mAP
(1)BOT global+BNNeck 94.5 84.5 86.4 76.4
(2)PCB partial+RPP 93.8 81.6 83.3 69.2
(3)MGN partial 96.6 94.2 88.7 78.4
(4)HPM partial 94.2 82.7 86.6 74.3
(5)ST Spatial-Temporal 98.1 99.3 94.5 92.7
(6)LU

二 方法介绍

1.BOT(global)

[1]Luo H, Jiang W, Gu Y, et al. A strong baseline and batch normalization neck for deep person re-identification[J]. IEEE Transactions on Multimedia, 2019, 22(10): 2597-2609.(罗浩)

paper:1906.08332.pdf (arxiv.org)

code:https://github.com/michuanhaohao/reid-strong-baseline

这篇文章的主要创新点为:

(1)提出了一个 仅提取全局特征,利用多种有效的trick(warmup,random erasing augmentation,label smooth,last stride) 的简单和高效的baseline。

(2)提出了BNNeck,解决分类交叉熵损失和度量三元组损失在空间中的不一致性,计算三元组损失后,特征经过BN层再计算交叉熵损失,将两个损失相加为最后的损失。

(3)研究了center loss对类内紧致性和类间远离性的效果,但会降低检索性能。

2.PCB(partial)

[2]Sun Y, Zheng L, Yang Y, et al. Beyond part models: Person retrieval with refined part pooling (and a strong convolutional baseline). In: Proceedings of the European conference on computer vision (ECCV), Munich, Germany, 2018. 480-496

paper:http://arxiv.org/pdf/1711.09349

这篇文章的主要创新点为:

(1)提出了一个提取标准分块特征的baselin:PCB。

(2)对于分块内的不一致性进行分析,发现块内部分向量与其他块相似度会更大,提出了重新分块池化(RPP),利用一个分类网络,计算向量对各个块的隶属度,以此计算feature map再进行全局平均池化

3.MGN(partial)

[3]Wang G, Yuan Y, Chen X, et al. Learning discriminative features with multiple granularities for person reidentification[C]//Proceedings of the 26th ACM international conference on Multimedia. 2018: 274-282.

paper:Learning Discriminative Features with Multiple Granularities for Person Re-Identification (arxiv.org)

code:https://github.com/Gavin666Github/reid-mgn

blog:(1条消息) 多粒度网络(MGN)的结构设计与技术实现_DRACOYU的博客-CSDN博客_多粒度

这篇文章的主要创新点为:

提出了一个端到端的提取多粒度(多尺度)特征的多分枝网络

从resnet50网络的conv4_2层分为三个分支,分别提取全局特征和部分,全局最大池化后得到2048维特征,利用1x1卷积降维为256,对于降维后的局部特征和降维前的全局特征计算分类损失,对降维后的全局特征计算三元组损失。

4.HPM(partial)

[4]Fu Y, Wei Y, Zhou Y, et al. Horizontal pyramid matching for person re-identification. In: Proceedings of the AAAI Conference on Artificial Intelligence, Honolulu, Hawaii, USA, 2019. 8295-8302

paper:https://arxiv.org/abs/1804.05275

code:https://github.com/OasisYang/HPM

这篇文章的主要创新点是借鉴了spp提出了水平金字塔池化Horizontal Pyramid Pooling

featuremap被分为四个branch,每个branch分为不同尺度的stripe,对每个stripe做GAP和GMP然后求和得到2048维特征向量,之后降维到256,按照分类的思想,接FC,计算分类softmax损失。在inference时,将各个维度的特征concat为3840维向量。这篇文章没有用度量损失,推理维度过高,计算量应该比较大,整体思路比较简单,效果还可以。

5.Spatial-Temporal Reid(多模态)

[5] Wang G ,  Lai J ,  Huang P , et al. Spatial-Temporal Person Re-identification[J].  2018.

paper:https://arxiv.org/pdf/1812.03282.pdf

code:https://github.com/Wanggcong/ Spatial-Temporal-Re-identification

这篇文章在外观信息(使用PCB)的基础上加入了有监督的时空信息(摄像头编号和时间信息)。主要贡献有三:1.双模态的结构2.时空信息直方图方法3.Logistic平滑方法

利用训练集的不同人出现在摄像头的时间差得到时空信息直方图,其横轴为按照不同时间差(论文采用100帧)划分很多个bin。

首先计算从相机i到相机j且时间差落入第k个bin的图像对为一个人的概率,其中代表从i到j且时间差为k的人的个数。

得到的图为上方左边的图,可以看到由于样本数少且时空信息随机性大,直方图很不平滑。于是引入Parzen Window method来进行平滑化。计算所有bin的p,乘高斯项(越靠近k越大),求和来计算,从而得到上方右侧较为平滑的图像。

最终得到了两个模态的信息,提出了Logistic Smoothing来聚合信息,将余弦相似度和时空匹配概率送入Logistic函数,相乘得到最终的概率,会使得pst的最小值不至于太小,这一步是为了防止,具有过小的时空匹配概率和很大外观相似度的样本被误判。

这个方法可以应用于任何具有相机编号和时间戳的数据集上,不过其鲁棒性不好说(假如有的人走了回头路?),可以加在在其他方法中试一试。

6.LUPerson(无监督预训练)

[6] Fu D , Chen D , Bao J , et al. Unsupervised Pre-training for Person Re-identification[J]. 2020.

paper:[2012.03753] Unsupervised Pre-training for Person Re-identification (arxiv.org)

code:https://github.com/DengpanFu/LUPerson

这篇文章将无监督学习方法MoCo应用于ReID领域,提出了无标签的LUPerson数据集,包含20万人400万张图片,利用改进的MoCo方法(改了下参数和数据增强方法)在LUPerson上预训练主干网络后,再在ReID数据集上训练baseline,显著提高了性能。

LUPerson的制作过程很有借鉴意义,作者在Youtube上搜索100个城市加街道名称,获取视频后进行初筛,筛掉视频长度太短的,重复的,静止的,VR视频等,之后利用YOLOv5进行检测,获得行人图片,之后利用HRNet做姿态识别来获取行人关键点判断行人是否完整,此外还有置信度,高宽比等限制条件,最终得到了无标签的数据集。

MoCo是何凯明等提出的一种contrastive learning 方法,详细可以参考博客:MoCo: Momentum Contrast 无监督学习 - 知乎 (zhihu.com),作者在此基础上调整有两点,1是数据增强方法中去除了颜色抖动(color jitter)因为颜色对于ReID模型学习到有判别力的模型是一个比较关键的信息),加入了ReID常用的随机擦除(RandomErasing).2是对contrastive loss的温度参数进行调整由0.2到0.07。这里温度参数越小,类间的差距会越大,因为相比于分类任务,ReID任务的类间差距更小,所以为了弥补这一差距,将温度参数减小。

行人重识别论文阅读(2021.7.3-7.11)相关推荐

  1. 【行人重识别论文阅读笔记——VPM】

    [阅读心得] 行人重识别经典论文--VPM 写在前面 1. Abstract 2. Introduction 3. VPM 3.1 Architecture 3.2 Inference 3.3 Sel ...

  2. 行人重识别论文阅读2-视频中基于时空相关性和拓扑学习的行人重识别(CTL)

    视频中基于时空相关性和拓扑学习的行人重识别 Spatial-Temporal Correlation and Topology Learning for Person Re-Identificatio ...

  3. [行人重识别论文阅读]无监督学习发展与小结

    Unsupervised domain adaptation (UDA) for person re-ID. UDA methods have attracted much attention bec ...

  4. [行人重识别论文阅读]Fine-Grained Shape-Appearance Mutual Learning for Cloth-Changing Person Re-Identification

    论文地址 论文代码:暂无 文章思想 在上篇文章中我们引入了sketch(行人轮廓图)的思想去解决换衣问题,但是我们会在实践中发现sketch的优劣性严重影响了最后实验结果的好坏.此篇论文的核心思想就提 ...

  5. [行人重识别论文阅读]Invariance Matters: Exemplar Memory for Domain AdaptivePerson Re-identification

    论文链接:https://arxiv.org/abs/1904.01990 代码:https://github.com/zhunzhong07/ECN Abstract 1.传统的无监督方法只关注于缩 ...

  6. [行人重识别论文阅读]AlignedReID: Surpassing Human-Level Performance in Person Re-Identification

    论文地址: 代码地址: Abstract 摘要部分明确提出了本文的重要思想,利用局部特征学习影响全局特征学习,并指出局部特征的学习方法是通过计算局部特征间的最短距离进而aligned局部特征. 原文: ...

  7. 行人重识别 代码阅读(来自郑哲东 简单行人重识别代码到88%准确率)

    来自郑哲东 简单行人重识别代码到88%准确率 阅读代码 prepare.py 数据结构 部分代码 一些函数 model.py ClassBlock ResNet50 train.py 一些参数 使用f ...

  8. 行人重识别论文--A Bottom-up Clustering Approach to Unsupervised Person Re-identification

    A Bottom-up Clustering Approach to Unsupervised Person Re-identification 目录 A Bottom-up Clustering A ...

  9. 行人重识别论文(五)Beyond Part Models: Person Retrieval with Refined Part Pooling

    论文地址 代码实现:Pytorch 摘要 作者主要的目标是学习描述局部信息特征.并且做出了以下两点贡献: 1. 提出了 Part-based ConvolutionalBaseline (PCB),给 ...

最新文章

  1. 【2016计概A期末】照亮房间
  2. java lambda::_基准测试:Java 8 Lambda和流如何使您的代码慢5倍
  3. Spring Cloud Feign 负载均衡
  4. 【转】visual studio 2019 (vs) 显示右侧缩略图_缩略图_滚动条
  5. POJ 3667 hotel(shǎ崽大神的模板|区间合并)
  6. Mac 使用Navicat连接Oracle提示:ORA-21561: OID generation failed
  7. HTML:雪碧图、高度塌陷和序号选择器
  8. 高考前最后一天,AI 监考老师已就位
  9. 【计算机网络学习笔记04】网络体系架构与网络协议
  10. OSError: exception: access violation writing 0x0000000000000000
  11. 宽带拨号连接显示被远程计算机终止
  12. 不会打字学计算机难吗,你知道你为什么学不会五笔吗 五笔难学吗
  13. 维棠flv视频下载软件 v2.0.9.4官方免费版
  14. 网络共享里的计算机无法打开,局域网共享文件夹打不开怎么办
  15. 入职华为od一个月的感受
  16. 【HGE引擎】源码解析——常用公共函数(二)
  17. 3ds_max入门教程
  18. python 获取昨天的时间
  19. 独家 | 利用深度学习来预测Spotify上的Hip-Hop 流行程度
  20. 【Unity3D 教程系列第 10 篇】Unity 脚本中的生命周期流程图

热门文章

  1. 屏蔽百度搜索结果中的广告
  2. 巴菲特称阿贝尔将是接班人;薄睿拓将卸任百威英博CEO邓明潇接任 | 高管变动2021年5月3日-9日...
  3. 我的投资、理财、财富观
  4. 《Android程序员指南》翻译暂停,望见谅
  5. Android相机开发和遇到的坑
  6. mysql怎么输出列表的次序_MySQL metalock的一些技巧(写大于读的案例,以及获得锁的顺序)...
  7. 注意力机制的详细理解
  8. 徐宗本院士讲座《关于大数据研究下的若干问题》摘记
  9. 33个高能CSS选择器让我受益匪浅
  10. 5分钟带你看懂区块链浏览器