Paper:https://arxiv.org/abs/1911.09318v2

Code:https://github.com/cvlab-yonsei/projects/tree/master/RRID/code

摘要:Re-ID旨在从一组相机网阵中捕获的图像中检索相关人员图像的任务。最近的Re-ID方法表明,利用描述身体部位的局部特征,加上行人图像本身的全局特征,即使在缺少身体部位的情况下,也能提供健壮的特征表示。然而,直接使用个体的局部特征,而不考虑身体各部分之间的关系,混淆了在相应部分具有相似属性的不同ID。为了解决此问题,我们为行人Re-ID提出了新的关系网略,它考虑了身体各个部分与其他部分之间的关系。我们的模型可使一个单独的部件级特征也包含身体其他部分的信息,从而使它更具有识别力。我们还介绍了一种全局对比池化方法(GCP)来获得行人图像的全局特征。我们提出通过GCP使用对比特征补充传统最大和平均池化方法。在三个公开数据集上展示了我们模型的有效性。

知识点解析:

a):概述:得到一张行人图像的特征图(C*H*W)。将得到的特征图水平分割成6网格。然后对每个特征图应用GMP,得到size为1*1*C的局部层次的特征图。我们将特征图送进两个模块中,以提取新的局部和全局行人表示:One vs rest模块和GCP。第一个模块通过考虑身体各部分与其余部分之间的关系,使得每个局部层次的特征更具有辨别力,并输出1*1*c的局部关系特征。第二个模块提供一个1*1*c的全局对比特征,表示行人图像本身。我们沿着通道维将全局对比和局部关系特征连接起来,并使用1*1*7c的特征作为Re-ID的行人表示。我们使用交叉熵和三元损失来训练我们的模型,其中三元组为anchor、positive和negative的行人图像。在测试时,我们提取行人图像的特征,并计算他们之间的欧式距离来确定行人的ID。

b):Relation networks for part-based reID:1):局部层次特征:我们利用在ImageNet预训练的ResNet-50作为主干网络,从输入的图像中提取初始特征图。具体来说,根据PCB的工作,我们将ResNet-50的GAP和全连接去掉,并将最后一个卷积层的stride设置为1。类似于其他基于局部特征的Re-ID方法,我们将初始特征图分成C*H/6*W的水平网格,对每个网格应用GMP,得到1*1*C的局部水平特征。2):One VS rest关系模块:从水平网格中提取局部层次的特征,可以隐式地利用身体的各个部分来表示不同的人。现有的Re-ID方法将这些局部特征独立地用于行人检索。考虑到行人图像之间的粗糙的几何对应,他们以特定的顺序将所有局部特征链接起来。虽然此结构化的行人特征可以对几何变化和遮挡,但是他们没有考虑身体部分之间的关系。也就是说,各个部分是孤立的,不与其他部分通信,这就分散了计算不同ID之间在相应部分中具有相似属性的相似度。为了缓解这个问题,我们提出利用身体各部分之间的关系来表示行人。具体来说,我们引入一个新的关系网络(图2),它利用身体部分的one VS rest关系,使得每个局部层次的特征都可以包含相应部分本身和其他身体部分的信息。具体来说,我们用(i=1...6)表示每个局部层次的特征,大小为1*1*C。我们对所有局部层次的特征应用同一个平均池化,除了特征,其他部分的信息按如下方式聚合:。然后我们分别在之后增加一个1*1的卷积层,分别得到大小为1*1*c的特征图。关系网络通过连接,为每一个输出一个局部关系特征。我们在图2中描述了一个提取局部关系特征的例子。在这里,我们假设包含它自身的信息和身体其他部分的信息。因此,我们使用一个跳转连接来传输的相关信息:。其中,是包含1*1卷积、BN和ReLU层的子网络。T表示特征的串联。支持局部层次的特征,增强了对遮挡的识别能力和鲁棒性。我们利用特征之间所有成对关系,但这需要大量的计算成本,并大幅增加特征的维度。相比之下,我们的one VS rest关系模块在线性时间内计算特征,并保持紧凑的特征表示。

c):GCP:为了表示一个完整的行人图像,以前的方式要么使用GAP,要么使用GMP,或者两者都有。GAP覆盖了行人图像的整个身体部分,但是容易被背景杂波和遮挡分散注意力。GMP克服了这一问题,它在丢弃背景杂波的同时,将对Re-ID有用的最具有判别性特征聚集起来。但是,这并不包含来自整个身体部分的信息。一种利用GAP和GMP的混合方法可能表现得更好,但它也受到背景杂波的影响。在【】中已经证明,GMP比GAP更有效,我们的实验也再次证明了这一点。基于此,我们提出了一种基于GMP的新的GCP方法,从行人各个部位提取全局特征图。我们在局部层次特征上首先应用平均和最大值池化,而不是在初始特征图上应用GAP或GMP。我们分别用表示分别用平均池化和最大值池化。注意,对背景杂波是健壮的,因为我们使用GMP方法来获得初始的局部特征。也就是说,我们将每个水平区域中最具判别性的部分整合起来。特别是,相对于主干网络的初始特征图,与GMP的结果相对应。然后,我们通过从中减去来计算出对比特征,即他们之间的差异。除了用的信息外,它还聚合来自身体各个部位的大多数判别信息。我们通过增加bottleneck层来减少的通道数量,分别用,最后将对比特征的互补特征传递给。形式上,我们得到输入图像的全局对比特征:。其中,是包含1*1卷积、BN和ReLU层的子网络。全局特征为基础,结合和对比特征的互补信息。因此,它继承了GMP的优点,如对背景杂波的鲁棒性,同时覆盖整个行人身体部分。我们将上式的全局对比特征与局部关系特征链接,作为行人图像的特征表示。

Conclusion:

我们为person reID提出了一个关系网络,考虑了身体各个部分与其余部分之间的关系,使得每个部分层次的特征更加具有辨别力。我们还建议使用对比特征来表示全局person。我们在person reID上设置了一个新的技术状态,远远超过了其他reID方法。消融分析清楚地证明了我们的模型中每个组件的有效性。

周郎有话说:论文中的one VS rest关系网络还是容易理解的。GCP有点绕。

Relation Network for Person Re-identification相关推荐

  1. 论文阅读:AAAI 2020 Relation Network for Person Re-identification 论文翻译

    Relation Network for Person Re-identification Hyunjong Park, Bumsub Ham∗ School of Electrical and El ...

  2. 小样本学习 | Learning to Compare: Relation Network for Few-Shot Learning

    博主github:https://github.com/MichaelBeechan 博主CSDN:https://blog.csdn.net/u011344545 Learning to Compa ...

  3. CNN结构:场景分割与Relation Network

    参考第一个回答:如何评价DeepMind最新提出的RelationNetWork 参考链接:Relation Network笔记  ,暂时还没有应用到场景中 LiFeifei阿姨的课程:CV与ML课程 ...

  4. Relation Network for Person Re-identification阅读总结

    Relation Network for Person Re-identification阅读笔记 What? 直接PCB太暴力了,没有考虑到块与块之间的关系.于是本文提出了一种one-vs-rest ...

  5. 加密流量分类-论文6:Learning to Classify A Flow-Based Relation Network for Encrypted Traffic Classification

    加密流量分类-论文6:Learning to Classify A Flow-Based Relation Network for Encrypted Traffic Classification 0 ...

  6. Learning to Compare: Relation Network 源码调试

    CVPR 2018 的一篇少样本学习论文 Learning to Compare: Relation Network for Few-Shot Learning 源码地址:https://github ...

  7. 关系网络 Relation Network

    文章目录 比较孪生网络.原型网络和关系网络 关系网络 Relation Network 实现过程 网络结构 损失函数 训练策略 算法推广 -- 推广到 zero-shot 创新点 算法评价 比较孪生网 ...

  8. I^2RNet: Intra- and Inter-Human Relation Network for Multi-Person Pose Estimation 笔记

    I2RNet: Intra- and Inter-Human Relation Network for Multi-Person Pose Estimation 前言 Background & ...

  9. 《Foreground-Aware Relation Network for Geospatial Object ......Remote Sensing Imagery》

    论文阅读笔记:<Foreground-Aware Relation Network for Geospatial Object Segmentation in High Spatial Reso ...

  10. [Relation Network]Realtion Networks for Object Detection (CVPR. 2018)

    文章目录 1. Motivation 2. Contribution 3. Object Relation Moudle 4. Relation Networks For Object Detecti ...

最新文章

  1. EA+svn实现UML的版本号控制
  2. 前端学习(1264):fetch响应结果
  3. java hive demo_java 操作hive通过jdbc
  4. JDK源码解析之 java.lang.Error
  5. 潜藏中国30年,营收远超老干妈6倍,它才是真正的隐形辣酱冠军
  6. springboot系列六、springboot配置错误页面及全局异常
  7. thymeleaf获取url地址跳转时所带参数
  8. 各数据类型的取值范围及占用字节数。。
  9. 超详细 Git 图文版小白教程(持续更新)
  10. mxonline实战14,全局搜索,修改个人中心页面个人资料信息
  11. Linux下TCP网络服务器实现源代码3
  12. 【数字信号】基于matlab GUI DTMF信号生成与检测(带按键音)【含Matlab源码 1086期】
  13. 在access中一列称为_ACCESS考试_笔试
  14. 计算机联锁常见的故障,计算机联锁系统常见故障及处理方法.doc
  15. Android TimePicker
  16. python+django大学教室自习室预约管理系统
  17. Win7虚拟机安装vs2019,亲测有效
  18. 【二分答案】买礼物的艰辛
  19. 上帝视角学JAVA- 基础07-类05【2021-08-06】
  20. linux网络命令--ping

热门文章

  1. “JSON parse error: Unexpected character (‘1‘ (code 49))的解决方式
  2. 骗子收录系统网站源码+搭建教程
  3. 省级瞪羚企业申报条件
  4. 二进制的骚操作-马赛克
  5. AgentWeb与JS 方法调用
  6. 深夜看了张一鸣的微博,让我越想越后怕…
  7. 品牌如何利用Instagram网红营销做好2023斋月推广?
  8. 基于C#的AE二次开发之地图标注
  9. Transaction rolled back because it has beenmarked as rollback-only
  10. 火眼金睛巧辨C与C++的不同之处