论文地址:https://arxiv.org/abs/1711.09349
代码地址:code

什么是行人重识别(ReID)

行人重识别(Person re-identification)也称行人再识别,是利用计算机视觉技术判断图像或者视频序列中是否存在特定行人的技术。广泛被认为是一个图像检索的子问题。 给定一个监控行人图像,检索跨设备下的该行人图像。旨在弥补目前固定的摄像头的视觉局限,并可与行人检测/行人跟踪技术相结合 ,可广泛应用于智能视频监控、智能安保等领域。

如下图,给定一个行人图或行人视频作为查询query,在大规模底库中找出与其最相近的同一ID的行人图或行人视频。

ReID任务描述

ReID任务一般包括两个部分:

  1. 特征工程,设计网络来学习不同场景下都general的visual feature,用probe-gallery的特征相关性来作为ranking的依据,一般直接Softmax分类。
  2. 、度量学习,设计损失函数,用多张图像的label来约束它们特征之间的关系,使学到的特征尽量类内间隔短,类间间隔大。

Beyond Part Models: Person Retrieval with Refined Part Pooling是清华大学孙奕帆于ECCV2018发表的一篇文章

摘要

论文包括两个部分:(1)

  1. 一个Part-based的Part-based Convolutional Baseline (PCB)框架,融合了水平切块的局部特征来得到一个强大的ReID特征;
  2. 一个refined part pooling (RPP) 方法,RPP会对水平切块边缘处的网格像素进行重新调整,将它们修正到正确的part分区。RPP可以理解为是一种注意力机制。

最终PCB+RPP不用任何re-ranking的方式来提点,在Market1501上可以达到93.8%的rank-1,是个很高的结果。

PCB框架流程:

  1. 对输入384128行人图提取深度特征(ResNet50),把最后一个block( averagepooling前)的下采样层丢弃掉,得到空间大小 248*2048的 tensor T。
  2. 按照水平方向分成均匀分成6parts,即6个空间大小 482048 tensor,然后各自进行 average pooling,得到6个column vectors g。
  3. 使用1*1卷积对g降维通道数,然后接6个FC层(权值不共享),Softmax进行分类。
  4. 训练时等于有 6个cross-entropy loss;测试时则将 6个 vectors h 合并在一起,再算相似度。

RPP(Refined Part Pooling)


为了了搞懂RPP,我们先定义一个术语——列向量。直观一点,列向量是指上图中每一个小网格的特征向量,即总共有24×8个列向量。接下来我们要调整每个列向量的part归属,假设某个列向量为f,我们要判断f要属于哪个水平块Pi

如上图所示,RPP思路:

  1. 把深度特征tensor T 中每个column vectors f 都分为6类(假设共有6个parts),文中是通过线性函数加Softmax来实现(其实就类似用1*1卷积来作segmentation一样。即最后对于所有的f,我们构造六个概率图(或者理解为mask、attention图都行),分别代表每个像素属于第i个part的概率。实现方式为在最后一层的特征图T后面接一个Conv2d得到一个6通道的张量,然后在最后在针对channel维度做softmax。

  2. 把每个part对应的attention map 权值叠加回 tensor T 里(即上图的 GAP过程),得到各 part 的spatial 空间压缩后的 feature vector g ~ 后续步骤都和PCB一样~
  3. 得到了概率图之后,再和原始的的特征进行相乘便可以得到最终refine之后的特征。现在的问题是如何训练这个新的Conv2d层来得到合适的概率图。这个卷积层是随机初始化的,要怎么才可以得到和PCB一样差不多的水平切块的概率图。论文提出的方式是先训练一个PCB网络,然后固定住除这个Conv2d层以外的所有层。因为PCB的概率图是人工切分的,所以用训练好的PCB去引导这个Conv2d层的训练,最后训练得到的概率图和水平切块的方式不会差太多,但是会微调一点点。

代码实现:

代码解读见下篇代码解读

参考资料:知乎–罗浩

关于行人重识别方法PCB《Beyond Part Models: Person Retrieval with Refined Part Pooling 》及代码实现解读相关推荐

  1. 中山大学提出新型行人重识别方法和史上最大最新评测基准

    点击上方,选择星标或置顶,不定期资源大放送! 阅读大概需要15分钟 Follow小博主,每天更新前沿干货 导读:行人重识别,是利用 CV 技术判断图像或视频序列中是否存在特定行人的技术.常规的行人重识 ...

  2. 中山大学提出新型行人重识别方法和史上最大评测基准

    本文转载自机器之心. 导读:行人重识别,是利用 CV 技术判断图像或视频序列中是否存在特定行人的技术.常规的行人重识别方法往往需要高昂的人工标注成本,计算复杂度也很大.在本文中,中山大学研究者提出的弱 ...

  3. 最强无监督行人重识别方法 Cluster Contrast ReID

    https://github.com/xiaomingzhid/sskd GitHub - JDAI-CV/fast-reid: SOTA Re-identification Methods and ...

  4. 最强无监督行人重识别方法 Cluster Contrast ReID,rank-1 94.6%

    代码连接: https://github.com/alibaba/cluster-contrast-reid 看了一下,主要是resnet50,resnet101训练的. 在行人重识别领域,如何获取海 ...

  5. 【Journal of Computer-Aided Design Computer Graphics】基于生成对抗网络的行人重识别方法研究综述

    文章目录 引言 数据集介绍 基于GAN的行人重识别方法分类 2.1基于风格转换的方法 2.2基于数据增强的方法 2.3基于不变性特征学习的方法 3 基于GAN的方法性能对比分析 总结 引言 对于行人检 ...

  6. 基于RK3588+TensorFlow的人工智能跨模态行人重识别方法及应用

    摘要: 跨模态行人重识别技术(cm-ReID)旨在可见光.红外等不同模态图像中识别出同一个人,其在人 机协同.万物互联.跨界融合.万物智能的智能系统与装备中有重要应用.提出一种数据增强的跨模态行人 重 ...

  7. [论文笔记]Beyond Part Models: Person Retrieval with Refined Part Pooling(PCB)

    Beyond Part Models: Person Retrieval with Refined Part Pooling(阅读) 几个关于这篇文章的博客 http://www.mclover.cn ...

  8. 抑制背景干扰的行人重识别方法

    摘要 目的:解决ReID中的相似背景干扰问题 方法: 对多摄像头监控场景下的ReID中的前景和背景的隐含关系进行分析 设计背景抑制网络模型,包括前景子网络,背景子网络和噪声抑制模块 在噪声抑制损失函数 ...

  9. 行人重识别论文(五)Beyond Part Models: Person Retrieval with Refined Part Pooling

    论文地址 代码实现:Pytorch 摘要 作者主要的目标是学习描述局部信息特征.并且做出了以下两点贡献: 1. 提出了 Part-based ConvolutionalBaseline (PCB),给 ...

  10. 囊括三大视觉顶会,行人重识别新基准方法AGW!已被TPAMI录用

    点击上方,选择星标或置顶,不定期资源大放送! 阅读大概需要13分钟 Follow小博主,每天更新前沿干货 来源:知乎 作者:叶茫 转载自:新智元 [导读]本文全面调研了近年来深度学习在Re-ID领域的 ...

最新文章

  1. 【Linux】一步一步学Linux——dpkg-reconfigure命令(272)
  2. jquery使用技巧总结
  3. undefined reference to `std::ios_base::Init::Init() 解决
  4. LeetCode 1874. 两个数组的最小乘积和
  5. php文件夹转换网页,PHP转换文件夹下所有文件的编码 适合发布网站的其他编码版本...
  6. CSS hack技巧大全 案例演示
  7. HTML5 Web Worker的使用
  8. iPhone 13高端版所需120Hz刷新率屏幕或将由三星独家供应
  9. 国潮国粹剪纸风京剧人物PSD素材,让东方韵味更浓
  10. ASM:《X86汇编语言-从实模式到保护模式》第8章:实模式下硬盘的访问,程序重定位和加载...
  11. VS2015 优化选项的开启
  12. 使用卡方分箱进行数据离散化-python实现
  13. 生成 Excel + PDF 导出,用 Java 实现
  14. 第四周作业part1
  15. 新浪短链接:15款最佳t.cn短网址在线生成工具
  16. Mac 使用Charles后,退出Charles后,不能浏览网页,提示:未连接到互联网代理服务器出现问题,或者地址有误。
  17. Java几种设计模式
  18. 腾讯应用宝如何认领应用详情(超详细)
  19. 利用尾插法建立单链表(纯C语言小白版)
  20. python中换行符怎么写_Python读写文件之换行符

热门文章

  1. T1076 正常血压(信息学一本通C++)
  2. 三国志战略版360区S4服务器合并信息,三国志战略版赛季区别 三国志战略版S4赛季与各赛季之间的区别_游侠手游...
  3. html 页面文字不能复制粘贴,网页文字无法复制粘贴 复制粘贴不能用
  4. 阿里云AI解决方案-身份证图像识别
  5. 2020暑期牛客多校训练营第九场(A)Groundhog and 2-Power Representation(高精度)
  6. 在立创商城上快速制作PCB原理图库
  7. Non-decreasing Array
  8. shell编程——select语句
  9. 强迫症狂喜!PC端相册还能智能分类!
  10. linux最新flash+player,Linux版Flash Player正式回归