汇总现阶段reid方面一些SOTA的paper。
汇总一些最近在公开数据集上刷分比较高的paper和报道:
一些结构上的思想大家可以学习借鉴下。
paper |
abstract |
Rank-1 (Market-1501) |
mAP( Market-1501) |
澎思科技 Pensees(nopaper) |
1.金字塔水平分块策略:采用 human parsing 对人体分割,去掉空集和全集将各子集进行多种方式组合,得到新的特征图。 2.训练阶段,借鉴 curriculum learning 思路,参与训练的样本按照学习难易度、按顺序进入和退出训练循环,模型在训练的同时评估各样本的难度,难样本比例逐步提升,使得损失函数更易收敛 3.图网络结构,网络在学习行人特征提取的同时还要学习区分不同部分的人体结构,有的放矢地在这些区域提取特征并进行池化可以大大减少背景信息造成的干扰。同时使用图卷积网络对人体各部分的特征之关系经行建模可以得到一个人的整体表示,各部分的特征向量首先堆叠在一起形成特征矩阵,使用一维卷积分别混洗每行和每列的特征,让信息在各部分、各通道之间流动,重复一定次数以后可以得到稳定的整体特征。 4.在测试阶段,除常规距离计算手段,引入重构距离,为了解决遮挡带来的精度下降问题,提出线性空间重构,利用参考图片的信息尝试尽可能地恢复残缺特征图,恢复后的特征图和参考特征图之间的距离即为重构距离。由此可以保证相似的图片之间可以互相重构,而不同个体的图片不管怎么重构都有一定的距离。从而提高了模型应对遮挡情况的能力。 |
96.73 |
89.89 |
赢识 WINSENSE(no paper) |
首先,通过采用注意力机制,并结合更加细粒度的基于金字塔的水平分块策略,来获取更加具有分辨力的局部区域特征;在此基础上结合在线难样本挖掘技术,通过对参与度量学习和分类学习的特征进行不同处理,进一步提升特征分辨力;最后,通过对特征的约束,提升特征的泛化能力。 |
96.59 |
91.77 |
《Joint Discriminative and Generative Learning for Person Re-identification》 |
将每个人通过生成器分别编码为外观编码和结构编码,通过切换外观编码或结构编码,生成高质量交叉ID合成图像,反馈给外观编码,用于改进识别模块。 |
94.8 |
86.0 |
《Perceive Where to Focus: Learning Visibility-aware Part-level Features for Partial Person Re-identification》 |
主要解决局部行人识别问题。利用局部可见感知模型(VPM)利用可见感知的特性,能够提取区域特征并比较两张图像的共享区域 (共享区域在两张图像上都是可见区域),从而局部行人重识别问题上取得更好的表现。 |
93.0 |
80.8 |
《Densely Semantically Aligned Person Re-Identification》 |
将图像中的行人分为24个语义身体部分,用二维UV坐标识别,然后生成密集语义对齐部分图像(DSAP-images),训练的时候用DSAP-images来引导图像特征学习。 |
95.7 |
87.6 |
《Towards Rich Feature Discovery with Class Activation Maps Augmentation for Person Re-Identification》 |
采用了一种类激活图(a Class Activation Maps, CAM)来增加基准模型上的激活范围,寻找更丰富的视觉线索,还提出了一种重叠激活惩罚,迫使当前的网络分支更多地关注之前较少被激活的图像区域,从而可以发现空间多样化的视觉特征。该网络中不同的分支会检测行人不同的位置 |
94.7 |
84.5 |
《AANet: Attribute Attentio Network for Person Re-Identification》 |
整合了多种人体属性和一种叫做attribute attention maps的特征图,AANet整合了身体局部区域关键的属性信息到一个学习网络框架中,包含三个任务:(1)整个身体鉴别任务(2)局部区域检测任务(3)关键属性检测任务。使用了任务ID和属性标签 |
93.89(resnet-50) 95.10(resnet-152, RR) |
82.45(resnet-50) 92.38(resnet-152, RR) |
《Interaction-and-Aggregation Network for Person Re-identification》 |
空间IA模块通过建模空间特征的关联来整合对应相同身体部位的特征。区别于卷积神经网络从一个固定的矩形区域提取特征,空间IA能够根据输入行人的姿态和尺度自适应的决定感受野。其次,通道IA模块通过建模通道特征的关联进一步增强特征表示。 |
94.4 |
83.1 |
《Re-Identification with Consistent Attentive Siamese Networks》 |
提出了the consistent attentive siamese network(CASN),包含了一个识别模块和一个siamese模块,识别模块只通过ID标签用明确的注意力引导作为监督寻找感兴趣行人的可靠位置信息和预测身份,siamese模块提供注意力一致的监控信号,确保从两张图片中获得同一行人的空间一致注意区域,从而为图像匹配学习视图不变特征表示。 |
94.4 |
82.8 |
《Pyramidal Person Re-IDentification via Multi-Loss Dynamic Training》(腾讯) |
出了一种新的由粗到细金字塔模型,首先将特征图输入到模型中,通过网络层数的增加将其不断进行细分为更小的部分,它不仅融合了局部和全局信息,而且整合了它们之间的渐进线索。用一种动态训练方案将identification loss和triplet loss统一起来。 |
95.7 |
88.2 |
云从 CloudWalk 飞龙R2算法(no paper) |
在之前的论文基础上提出“基于感受野的行人多粒度特征提取理论” |
96.4 |
91.14 |
ReID-2019 Alibaba(no paper) |
该团队通过局部信息的挖掘,专注于解决行人在识别过程中表观姿态变化剧烈,不容易对齐的问题。一方面,通过人体得到具有强语义信息的部件,并利用在其中寻找最具有区分性的区域。另一方面,使用了基于金字塔的水平分块策略,得到行人固定区域的可辨识信息。在训练中,同时采用两种策略相结合的方式,达到行人图片的对齐,从而实现更精准的匹配识别。 |
96.35 |
90.58 |
Dahua Tech(no paper) |
基于人体结构的分块模型,提取显著的局部特征;融合多层语义信息,学习不同层级特征,使得特征更具表达能力;利用空间注意力模型解决局部特征对齐问题。 |
- |
88.58 |
汇总现阶段reid方面一些SOTA的paper。相关推荐
- 【论文汇总】CVPR2020语义分割医学图像分割paper汇总
语义分割&医学图像分割 segmentation@CVPR2020 CVPR2020语义分割和医学图像分割文章总结 文章目录 语义分割&医学图像分割 segmentation@CVPR ...
- CV方向介绍 | 基于自然语言的跨模态行人re-id的SOTA方法简述(上)
点击我爱计算机视觉标星,更快获取CVML新技术 本文转载自52CV群友Jokie的知乎 https://zhuanlan.zhihu.com/p/69559437 这是上篇,期待作者早日出下篇- 撒花 ...
- [ECCV 2020] Robust Re-Identification by Multiple Views Knowledge Distillation,利用知识蒸馏实现最鲁棒Re-ID
导言 这项工作设计了一项训练策略,允许从描述目标对象的一组视图产生高级知识.我们提出了Views Knowledge Distillation (VKD),将这种visual variety (视觉多 ...
- 多目标跟踪综述、论文、数据集大汇总 Awesome Multiple object Tracking
Awesome Multiple object Tracking(持续更新) 综述 论文 2022 2021 2020 2019 2018 2017 2016 数据集 综述 Multiple Obje ...
- 【AdaSeq基础】30+NER数据汇总,涉及多行业、多模态命名实体识别数据集收集
简介 命名实体识别NER是NLP基础任务,一直以来受到学术界和业界的广泛关注,本文汇总了常见的中英文.多语言.多模态NER数据集介绍. 相关数据详情可以访问链接: https://github.com ...
- TMM|车辆重识别的一些实践
本文转载自知乎,已获作者授权转载. 链接:https://zhuanlan.zhihu.com/p/186905783 这篇文章是我们在CVPR2020 智慧城市AICity比赛中 得到冠军的基础,发 ...
- mysql TMM_TMM|车辆重识别的一些实践
本文转载自知乎,已获作者授权转载. 链接:https://zhuanlan.zhihu.com/p/186905783 这篇文章是我们在CVPR2020 智慧城市AICity比赛中 得到冠军的基础,发 ...
- 非计算机专业自学1年拿到算法offer的总结(附学习路线)
本文总结自己学习计算机视觉的经历. 我就是非计算机专业的,在18-19年1年时间内自学拿到商汤实习offer,20年毕业加入思谋成为一名算法工程师. 之前写过一个实习面经,感兴趣的可以看一下计算机视觉 ...
- 深度学习-语义分割总结
翻译自qure.ai 什么是语义分割 对图片的每个像素都做分类. 较为重要的语义分割数据集有:VOC2012 以及 MSCOCO . 有哪几种方法 传统机器学习方法:如像素级的决策树分类,参考Text ...
最新文章
- c++ map 析构函数_C++学习刷题6--C++类的使用:构造函数、析构函数和类的使用
- Spring工厂注入例子
- hdu1999 不可摸数 好题.
- 玩转Eclipse — 自动代码规范检查工具Checkstyle
- (30)保护模式阶段测试
- 【Tiny4412】烧写Uboot到EMMC
- html中img显示旋转,css如何实现图片的旋转展示效果(代码示例)
- ArcMap没有工具条和菜单栏的解决方法
- unityAPI文档离线下载
- 小米4 第三方re奇兔_小米手机刷机教程整合版
- ARM64体系结构编程与实践:基础知识
- win11 鼠标样式修改(大小和颜色)
- 计算机配置windows设置脚本,如何设置脚本操作
- 09.第十章.项目沟通和干系人管理
- ubuntu 终端查看图片(eog)
- 11月最新系统GHOST XP SP3 电脑城快速装机版 V2011.11
- 习题6-5 UVA1600 巡逻机器人 Patrol Robot
- Linux配置Java环境
- 《On Java 8》中不理解的段落
- baidu文库爪巴虫——xls
热门文章
- 树莓派3B+采用花生棒进行内网穿透,从拆箱到实现SSH远程控制与sftp简单远程文件上传下载
- C语言基础教程 之 系统关键字
- windows server 2012 上 oracle客户端卸载步骤干净_攻防|客户端渗透
- 路由器上的一些常见端口
- 【2 - 数据库是如何存储数据的】Sql Server - 郝斌(字段、记录、表;图形化界面及sql语句建表;六种约束;一对一、一对多、多对多、数据库关系图;主外键)
- SEO搜索引擎优化-引擎排名
- 学习手扎20190313——dick操作(增删改查)
- linux少了 dev dm设备,已解决: Linux中安装了powerpath之后为什么还会有dm设备? - Dell Community...
- flutter 获取视频缩略图video_thumbnail
- 前端面试技巧和注意事项_web前端没有项目经验怎么应对面试?(技巧) -