论文笔记:Deeply-Learned Part-Aligned Representations for Person Re-Identification
论文笔记:Deeply-Learned Part-Aligned Representations for Person Re-Identification
简介
这是ICCV2017的一篇person Re-id的论文。论文提出了一种新的对其方法,以便在摄像机移动的场景下,更准确地匹配不同姿势、位置的person re-identification。不同于以往常用的空间分割方法,本文采用人类身体部分分割(human body part partition)。
方法
以往的align方法主要是通过空间位置进行对其,但是检测框是算法生成的而非人为标注的,并且人的姿势也会改变,通过这种方法进行对其往往有巨大的误差,如图所示:
首先用一个FCN提取整张图片的特征图,对于这个特征图,使用K个分支网络提取区域特征,最后将这K个分支拼接起来就是最终的hunman representation。
其中,Feature map是一个3维的特征图,用t(x,y,c)表示第c个(x,y)位置的响应;分支网络学习到的结果是一个2维的mask——MkM_kMk(类似于像素级别的注意力权重),mk(x,y)表示(x,y)位置落在第k个区域的程度。将t和m点乘,并通过一个平均池化,就可以得到一个分支(区域)的特征向量。
tk(x,y,c)=t(x,y,c)×mk(x,y)t_{k}(x,\ y,\ c)=t(x,\ y,\ c)\times m_{k}(x,\ y)tk(x, y, c)=t(x, y, c)×mk(x, y)
fk(c)=Averagex,y[tk(x,y,c)]{f}_{k}(c)=\mathrm{Average}_{x,y}[t_{k}(x,\ y,\ c)]fk(c)=Averagex,y[tk(x, y, c)]
计算得到的k个f通过线性降维再拼接,就可以得到整张图的特征向量。
如图表示了每个分支所提取的区域的可视化结果。由图可以看出基本上每个分支提取的都是人体相同的部分。
论文笔记:Deeply-Learned Part-Aligned Representations for Person Re-Identification相关推荐
- 论文笔记--Efficient Estimation of Word Representations in Vector Space
论文笔记--Efficient Estimation of Word Representations in Vector Space 1. 文章简介 2. 文章概括 3 文章重点技术 3.1 NNLM ...
- 【论文笔记——DIM】Learning Deep Representations By Mutual Information Estimation and Maximization
arxiv:https://arxiv.org/abs/1808.06670 code:https://github.com/rdevon/DIM report video:https://www.y ...
- Visual Question Answering with Textual Representations for Images 论文笔记
Visual Question Answering with Textual Representations for Images 论文笔记 一.Abstract 二.引言 三.方法 3.1 Lang ...
- 论文笔记--Deep contextualized word representations
论文笔记--Deep contextualized word representations 1. 文章简介 2. 文章概括 3 文章重点技术 3.1 BiLM(Bidirectional Langu ...
- 论文笔记:Decoding Brain Representations by Multimodal Learning of Neural Activity and Visual Features
论文笔记:Decoding Brain Representations by Multimodal Learning of Neural Activity and Visual Features(通过 ...
- 论文笔记:Evolving Losses for Unsupervised Video Representation Learning
Evolving Losses for Unsupervised Video Representation Learning 论文笔记 Distillation Knowledge Distillat ...
- 【论文笔记】Encoding cloth manipulations using a graph of states and transitions
[论文笔记]Encoding cloth manipulations using a graph of states and transitions Abstract 问题: Cloth manipu ...
- 论文笔记-Vanilla Transformer:Character-Level Language Modeling with Deeper Self-Attention
论文笔记-Vanilla Transformer:Character-Level Language Modeling with Deeper Self-Attention 1. 介绍 2. Chara ...
- 《Improved Crowd Counting Method Based onScale-Adaptive Convolutional Neural Network》论文笔记
<Improved Crowd Counting Method Based onScale-Adaptive Convolutional Neural Network>论文笔记 论文地址 ...
最新文章
- 知乎2w人关注,没有工程开发经验的人是怎么找到工作的?
- #1045 - Access denied for user 'root'@'localhost' (using password: NO)
- Android Studio一直处于Building的解决方法
- 在RichTextEditor组件中使用自定义右键。
- mysql5.7 备份
- python模块import具体用法
- 坚持的力量 第十一篇
- Linux 进程间通讯方式 pipe()函数
- 迁移学习和数据扩充(附代码)
- 面试总结:给应届生一些找工作的基本建议,毕竟我踩坑多
- python运行系统找不到指定文件_系统找不到指定文件怎么解决
- 个人作品 轻航 - 社区商城系统
- 网站漏洞整改报告公司之攻防方案
- 【一起入门NLP】中科院自然语言处理第16课-简明扼要:红到发紫的prompt是什么?【上】
- ubuntu teamviewer
- 根号 巴比伦_建立巴比伦卫生设计系统
- tf-faster-rcnn训练报错: Loaded runtime CuDNN library: 7.0.5 but source was compiled with: 7.1.4.r-rcn
- 什么是RFID及其特点
- kingcms php 漏洞,kingcms5.0/5.1漏洞
- SEO从业者打造个人品牌的八个建议
热门文章
- UE4 角色预览与头像生成 CaptureSceneComponent2D 看这一篇就够了
- windows引导文件丢失解决办法
- Multi-scale Interactive Network for Salient Object Detection(用于显著性目标检测的多尺度交互网络)
- CSDN官方夏日福利来袭!限时抽吸尘器/键盘/月卡等清爽大礼,100%必得大奖!
- PMBOK第7版——「8大绩效域」解析
- 汉字 计算机 坟墓,墓字的意思4、墓的繁体字、墓的笔顺笔画、墓字部首和繁体字墓的意思...
- 所有TXT记事本文件都打不开了,提示:“Windows 找不到文件”怎么解决?
- JavaScript中大括号“{}”作用
- 查看系统时间和硬件时间
- centos7 docker 安装企业版kong