A Bottom-up Clustering Approach to Unsupervised Person Re-identification

目录

A Bottom-up Clustering Approach to Unsupervised Person Re-identification

1. Introduction

2. 贡献:

3. 流程图

示例

4. Methodology

4.1 Preliminary

4.2 Bottom-Up Clustering method (BUC)

4.3 Diversity Regularization

5. 实验结果


1. Introduction

现有的大部分行人重识别方法都是基于监督学习的,需要对训练数据进行人工标注,然后对于大型的数据集,人工标注的成本太高。
传统的无监督方法侧重于手工特性。这些方法产生的性能比监督方法低得多,不适用于大规模的实际数据。 
基于深度学习方法的“无监督”行人重识别利用了从其他reid数据集中学到的先验知识。
这篇文章解决的是无任何标签的无监督行人再识别问题,作者提出了一种自底向上聚类方法(bottom-up clustering BUC)来联合优化CNN和无标签样本间的关系。

2. 贡献:

提出了自底向上聚类框架来解决无监督行人重识别,在保持最大化相同身份的行人之间的相似性的同时最大化的保存行人之间的多样性。
利用repelled loss 直接优化样本或聚类的之间的余弦距离来优化没有标签的模型。使得不同类之间的多样性最大化,每个聚类或样本的相似性最大化。
多样性归一化项能够平衡每个聚类的聚类数目,使得聚类结果与真实分布更加的接近。

3. 流程图

本文的流程图如图所示,主要分为三个步骤,将一个没有标签的行人图片作为输入
1.首先通过CNN网络来提取行人特征用来聚类。
2.然后在整个数据集中聚类合并,
3. 最后根据聚类后的结果重新训练模型,
不断迭代执行这三个步骤,直到行人身份多样以及相似性达到最大化之后结束。

示例

该图是对本文执行过程举一个简单的例子。N表示训练样本的数量,C表示聚类之后的聚类数量。在最开始执行的时候,我们将数据集中的每个样本都作为一个单独的聚类,由于本文是没有真实的标签,因此,我们将聚类序列ID作为标签。随着聚类的不断迭代,每次聚类都是利用前一个阶段的聚类的结果以及现阶段的特征相似性进行聚类。这样就可以不断的合并相同身份的样本,聚类结果也在不断的更新变化,每次聚类结束之后都将新的聚类ID 作为训练样本的标签。
这样,通过自底向上的聚类可以将身份相同的行人样本聚为一类。

4. Methodology

4.1 Preliminary

 

4.2 Bottom-Up Clustering method (BUC)

CNN提取特征后,和查找表计算cosine距离:?其中,每个样本属于第C个聚类的可能性可以用下面的式子表示。X表示训练样本数据,C表示聚类数量。V表示一个查找表,查找表中存储的是每个聚类特征,Vj表示V中的第j个元素,包含第j个聚类中所有图片的特征信息。分别计算当前样本特征x和查找表每类特征间的cosine距离,然后除以和所有类特征间距离之和(类似softmax)作为x属于这类的概率。除以温度参数τ,控制每个样本的聚类结果的柔软性,然后,对x所属的类y^i使用下式计算loss。在反向传播过程中,V的更新通过式子进行更新,将原来聚类的特征与新的数据特征进行求和并求平均。查找表V可以避免在每个训练步骤中从所有数据中提取特征的冗长计算。 
每次聚类完成之后,训练图片的标签都会更新为最新的聚类ID。

对于迭代过程中,聚类的合并方式,作者采用层次聚类的方法来自底向上合并类。
步骤一:(初始化)将每个样本都视为一个聚类;
步骤二:计算各个聚类之间的相似度;
步骤三:寻找最近的两个聚类,将他们归为一类;
作者聚类的合并采用最小距离策略来计算两个聚类之间的多样性。最小距离策略是计算两个聚类之间每个元素的欧几里得距离,然后将聚类之间元素的最短聚类作为两个聚类之间的多样性距离,用下面的式子表示。但是每次合并时,聚类的合并并不是任意的。从小到大合并固定数量,作者通过指定每次聚类合并过程中聚类合并数量来控制聚类合并的速度。每次迭代剩余类数:C=N-t*m。类间距离计算公式如下:

此外,作者还测试了另外两种合并策略,一种是最大距离策略,选择每个聚类元素之间的最大距离作为多样性,这种策略可能导致同一身份不同摄像头的行人被划分为不同的类。另外一种是中心聚类策略,选择每个聚类的元素平均特征进行度量。但是平均操作可能忽视掉有用的相机信息,最终使用最小距离策略的准确率最高,因此,作者最终采用了最小距离策略作为聚类合并的策略。

4.3 Diversity Regularization

由于我们在实验过程中不知道每个样本图片的身份,但是我们假定每个身份的行人图片的数量是相近的。基于这一点考虑,作者加入了一项多样性归一化项约束,约束项如下面的公式所示:其中|A|表示聚类A的数量。最终的多样性距离公式可以用下式表示。这样当我们两个聚类的欧几里得距离较近,但是两个聚类都包含较多的图片时,总的距离较大,这样就避免了这两个聚类的合并,在一定程度上可以提高准确率。

第一次迭代C=N,然后使用X,Y和训练CNN。训练完成后根据类间距离合并m个类,然后重新用样本所属的新类作为新标签Y,再次训练CNN。然后迭代这个过程。每次迭代后,在测试集上测试网络的表现,当网络表现下降时停止迭代。

5. 实验结果

相同颜色的点表示相同身份的图像。我们展示了一个正面示例(绿色圆圈)和一个负面示例(红色圆圈)的详细图像。绿色圆圈中的点是相同的。在红圈中,绿点和黄点聚集在一起,说明我们的算法误将它们合并成一个簇。

行人重识别论文--A Bottom-up Clustering Approach to Unsupervised Person Re-identification相关推荐

  1. 行人重识别论文阅读2-视频中基于时空相关性和拓扑学习的行人重识别(CTL)

    视频中基于时空相关性和拓扑学习的行人重识别 Spatial-Temporal Correlation and Topology Learning for Person Re-Identificatio ...

  2. 【行人重识别论文阅读笔记——VPM】

    [阅读心得] 行人重识别经典论文--VPM 写在前面 1. Abstract 2. Introduction 3. VPM 3.1 Architecture 3.2 Inference 3.3 Sel ...

  3. [行人重识别论文阅读]无监督学习发展与小结

    Unsupervised domain adaptation (UDA) for person re-ID. UDA methods have attracted much attention bec ...

  4. [行人重识别论文阅读]Fine-Grained Shape-Appearance Mutual Learning for Cloth-Changing Person Re-Identification

    论文地址 论文代码:暂无 文章思想 在上篇文章中我们引入了sketch(行人轮廓图)的思想去解决换衣问题,但是我们会在实践中发现sketch的优劣性严重影响了最后实验结果的好坏.此篇论文的核心思想就提 ...

  5. [行人重识别论文阅读]Invariance Matters: Exemplar Memory for Domain AdaptivePerson Re-identification

    论文链接:https://arxiv.org/abs/1904.01990 代码:https://github.com/zhunzhong07/ECN Abstract 1.传统的无监督方法只关注于缩 ...

  6. 行人重识别论文阅读(2021.7.3-7.11)

    一 各种方法性能比较 Method Key Market  r1 Market mAP Duke r1 Duke mAP (1)BOT global+BNNeck 94.5 84.5 86.4 76. ...

  7. 行人重识别论文(五)Beyond Part Models: Person Retrieval with Refined Part Pooling

    论文地址 代码实现:Pytorch 摘要 作者主要的目标是学习描述局部信息特征.并且做出了以下两点贡献: 1. 提出了 Part-based ConvolutionalBaseline (PCB),给 ...

  8. AAAI2022行人重识别论文汇总

    会议官网接受list: AAAI2022接收列表 emmm 目前只查到了两篇挂在了arxiv上- 3.3更新:又有一篇DG reid挂出来了 person re-identification 总计 1 ...

  9. ECCV2022 行人重识别论文汇总

    跨模态reid 971 Optimal Transport for Label-Efficient Visible-Infrared Person Re-Identification 3677 Cou ...

最新文章

  1. 7 1学会使用 Node 编写简单的前端应用
  2. SD-WAN — 云专线(企业入云)
  3. 程序员面试题精选100题(20)-最长公共子串[算法]
  4. thinkphp5 获取当前的域名
  5. 【工业】工业控制博客汇总
  6. 练习四十四:整数的排序
  7. SWOT分析思维的一些基本思考与见解
  8. 物业公众号推文范例_《爱物业》物业服务公众号平台
  9. DNS域名解析服务介绍
  10. opencv3_java 图像的修剪裁剪Trimming Rect
  11. 【Pandas】常用姿势积累
  12. 古龙108将,喜欢古龙的来看啦
  13. IT招聘惨淡季?求职者无offer,招聘者无简历
  14. Lake Shore PT-100铂电阻温度传感器
  15. casio计算机如何计算标准差,怎样在卡西欧5800里计算标准差和方差,不要普通计算,用里面设计好的模式,...
  16. python学习之爬取ts流电影
  17. windows调整窗口大小_175 Windows 7调整,提示和操作方法文章
  18. 福建农林大学计算机课程表,福建农林大学金山学课程表.doc
  19. Android 中文API网址
  20. JQuery中的id选择器含有特殊字符时,不能选中dom元素的解决方法

热门文章

  1. 一元交友源码对接码支付免费送
  2. SpingMVC项目Servlet[springmvc]的Servlet.init()引发异常
  3. 告诉你十一个腰椎间盘突出症的锻炼方法
  4. 计算机中恢复是什么的反操作,Windows 7 中的“系统恢复”选项是什么?
  5. 使用 iPad 远程访问 win10
  6. OpenVINO™场景文字识别与同步与异步推理
  7. 【点云处理技术之open3d】第四篇:使用open3d绘制常用类型——箭头、圆柱、长方体、球形、箭头、坐标轴和线条
  8. https怎么防止流量劫持
  9. 继往开来,中国移动与日本软银引领TD-LTE产业进入5G时代
  10. Catch That Cow(详解)