2020Arxiv之ReID:Deep Learning for Person Re-identification: A Survey and Outlook
Deep Learning for Person Re-identification: A Survey and Outlook
本文是夜盲团队在今年发表的综述类文章:
论文地址:
https://arxiv.org/abs/2001.04193v1
AGW开源地址:
https://github.com/mangye16/ReID-Survey
当前的问题及概述:
作者调查了245篇近两三年的行人重识别(Person Re-identification)论文,分类为封闭世界ReID与开放世界ReID,综述了该方向的技术进展,对未来ReID技术发展给出了几个有价值的方向。下图可见,在是否是异质数据、标注是否完备、是否含有噪声等方面,开放世界ReID更接近实际应用。
本文做了3方面工作:
1)对现有的深度学习方法进行了深入全面的分析,讨论了它们的优势和局限性。
2)为未来的开发设计了一个新的强大的AGW基线和一个新的评估度量(mINP)。AGW实现了最先进的性能,在单一和交叉模态Re-ID任务。mINP为现有的CMC/mAP提供了一个补充指标。
3)讨论几个重要的研究课题,以缩小封闭世界和开放世界应用之间的差距,向现实世界的Re-ID系统设计迈出一步。
ReID综述:
1.ReID技术的五大步骤:
1)数据收集;2)包围框生成;3)训练数据标注;4)模型训练;5)行人检索
2.CLOSED-WORLD PERSON RE-IDENTIFICATION
1)特征表示学习方法:
a)全局特征,学习每个人图像的全局表示;
b)局部特征,学习部分聚合的局部特征;
c)辅助特征,利用辅助信息学习特征表示(分割,viewpoint,domain,GAN)
d)视频特征,利用多图像帧和时间信息学习视频表示.
2)度量学习中的loss函数设计:
常用的3中loss:(a) Identity Loss (b) Verification Loss © Triplet Loss以及他们的组合
Id loss:常用交叉熵loss
Verification Loss:一种为contrastive loss,一种为binary verification loss
其中contrastive loss:其中,ij为正样本时,δij = 1,相反为0
带有交叉熵的binary verification loss:其中, fij = (fj − fj)2 表示i,j两样本的差分特征
Triplet loss:
Online Instance Matching (OIM) loss:在线学习loss,一个内存库{vk, k = 1,2,··,c}包含存储的实例特性,其中c表示类号:
3)重排序优化:由易到难进行re-ranking排序
4)closed-world setting dataset:
约11个dataset:
评价指标为CMC(rank-n)或mAP
State-of-the-arts(SOTA) :
3 OPEN-WORLD PERSON RE-IDENTIFICATION:
1)异质数据ReID
基于深度ReID;
文本到图像ReID;
可见光到红外ReID;
跨分辨率ReID;
2)端到端ReID
纯图像/视频的ReID;
多摄像头跟踪的ReID;
3)半监督和无监督的ReID
其中无监督ReID SOTA方法统计:
4)噪声鲁棒ReID
5)开放集合ReID
4.AN OUTLOOK: RE-ID IN NEXT ERA
1)mINP:本文提出的新的评价标准
设计了一个计算效率的度量,即负惩罚(NP),它度量惩罚来找到最难的正确匹配:
Rhard表示最难匹配样本的rank位置,Gi表示i的正确匹配总数。
为了与CMC和mAP的一致性,我们倾向于使用逆负惩罚(INP),一种NP的逆运算:
在不同模型比较:
2)提出了一个新的baseling:AGW
I:Non-local Attention (Att) Block
采用强大的非局部注意块得到所有位置特征的加权和:
II:Generalized-mean (GeM) Pooling
III:Weighted Regularization Triplet (WRT) loss
跨模态ReID比较:
5.Under-Investigated Open Issues
1)Scalable Re-ID
实现快速检索、轻量级网络、根据硬件配置自适应地调整模型
2)Domain Generalized Re-ID
多域(摄像机)数据集、多质(多模态等)数据集、
3)Minimizing Human Annotation
少标注、学习虚拟数据
4)Dynamic Camera Network
5)Domain-Specific Architecture Design
2020Arxiv之ReID:Deep Learning for Person Re-identification: A Survey and Outlook相关推荐
- Deep Learning for 3D Point Clouds: A Survey 论文阅读
点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 Abstract:在点云深度学习中,主要包含的任务有:3D形状分类.3D目标检测和跟踪.3D点云分割. ...
- Data Mining 论文翻译:Deep Learning for Spatio-Temporal Data Mining: A Survey
原文链接:[1906.04928] Deep Learning for Spatio-Temporal Data Mining: A Survey (arxiv.org) IEEE Transacti ...
- 【点云系列】综述: Deep Learning for 3D Point Clouds: A Survey
文章目录 起因 题目 摘要 1 简介 2 背景 2.1 数据集 2.2 衡量指标 3 3D形状分类 3.1基于多视角的方法 3.2基于体素的方法 3.3 基于点的方法 3.3.1逐点MLP网络 3.3 ...
- Deep Learning for 3D Point Clouds: A Survey - 3D点云的深度学习:一项调查 (IEEE TPAMI 2020)
Deep Learning for 3D Point Clouds: A Survey - 3D点云的深度学习:一项调查(IEEE TPAMI 2020) 摘要 1. 引言 2. 背景 2.1 数据集 ...
- Deep Learning for Visual Tracking: A Comprehensive Survey(单目标跟踪目前最好的综述类文章)
Deep Learning for Visual Tracking: A Comprehensive Survey https://arxiv.org/pdf/1912.00535.pdf 摘要 视觉 ...
- 《Deep Learning Techniques for Music Generation – A Survey》深度学习用于音乐生成——书籍阅读笔记(一)Chapter 1
<Deep Learning Techniques for Music Generation – A Survey>深度学习用于音乐生成--书籍阅读笔记(一)Chapter 1 关于这本书 ...
- Deep Learning for Generic Object Detection: A Survey -- 目标检测综述总结
最近,中国国防科技大学.芬兰奥卢大学.澳大利亚悉尼大学.中国香港中文大学和加拿大滑铁卢大学等人推出一篇最新目标检测综述,详细阐述了当前目标检测最新成就和关键技术.文章最后总结了未来8个比较有前景的 ...
- How to Build a Graph-Based Deep Learning Architecture in Traffic Domain A Survey
How to Build a Graph-Based Deep Learning Architecture in Traffic Domain: A Survey 1. 文章概述 1.1 本文主要内容 ...
- 【论文翻译】点云深度学习综述 -- Deep Learning for 3D Point Clouds: A Survey
论文链接:Deep Learning for 3D Point Clouds: A Survey 文章目录 摘要 1. 介绍 2. 三维形状分类 2.1 基于投影的网络 2.1.1 多视图表示 2.1 ...
- 三维点云语义分割【综述】 ——Deep Learning for 3D Point Clouds: A Survey
3D POINT CLOUD SEGMENTATION 3D Semantic Segmentation Projection-based Networks Point-based Networks ...
最新文章
- 某大厂程序员抱怨:“大厂镀金”是鬼话!从大厂裸辞后,面阿里、字节全都挂掉,连货拉拉都不要自己!...
- 升级BIOS解决DELL R730XD虚拟机死机问题
- python安装scipy
- 量子计算机,开启中国速度
- Individual
- 2015结束,2016开始
- LeetCode刷题: 整数反转
- SAP Fiori Lead应用中Accept按钮显示隐藏的逻辑
- caffe 关于Deconvolution的初始化注意事项
- netapp做内网穿透有问题
- javascript学习(11)——[设计模式]工厂模式
- leetcode解题记录(二)
- Flex与.NET互操作系列文章索引
- Doris之备份与恢复(全面)
- webgis之qgis缓存
- 织梦采集侠破解版_最新dedecms织梦采集侠v2.6破解版
- 【20191025】考试
- 【C语言|数组】数组a、a、a[0]、a[0][0]的区别与联系
- jdk1.8 stream() 把List <String>变成String
- 使用curl创建HTTP请求 Using curl To Make HTTP Requests--用Enki学Linux系列(3)
热门文章
- 【3.0】 常见的插值算法
- [论文阅读笔记41]关于医学的bert专题
- 我的服务端之C++网络库对外接口
- 诺基亚5230_5235_RM-356刷机包20.6.006版
- 运用主定理计算递归问题时间复杂度
- VSCode SSH 免密登录
- 信号集 SIGINT, SIGTERM, SIGKILL
- 实战篇:Linux7 安装 Oracle 19C RAC 详细图文教程
- SpringBoot重点详解--log4j.properties配置详解与实例
- 潭州课堂25班:Ph201805201 周五 (课堂笔记)