Paper:https://arxiv.org/abs/1908.01114

Code:https://github.com/TAMU-VITA/ABD-Net

摘要:注意力机制已经被证实可以有效的应用在行人重识别领域。然而,利用注意力机制学习到的特征通常是相关的和不具有多样性的。我们通过提出一个专注又多样化的网络(ABD-Net)来说明注意力机制和多样性的互补力量。ABD-Net通过在网络中无缝的嵌入注意力模块和多样性规则化,来学习具有代表性、健壮性和更具鉴别力的特性。具体来说, 我们介绍了一对互补的注意力模块,分别关注于通道聚合和位置感知。然后,我们插入一个新的正交约束,有效的促进隐藏激活和权重的多样性。通过消融性试验,我们验证了注意力和多样性方法均有助于ABD-Net的性能提升。通过在公开数据集上试验,我们的算法实现了SOTA。

知识点解析:

1,注意力机制:基于通道维和空间维

a:基于通道维的注意力机制:众所周知,经过训练的CNN分类器中的高级卷积信道是语义相关的,并且通常具有分类选择性。在Re-ID研究中,我们假设高层次的通道也是分组的,即一些通道共享相似的上下文语义,并且彼此之间的关联性更强。Channel  Attention Module(CAM)被设计用来对那些语义相似的通道进行分组和聚合。

假设输入的特征图,其中C、H和W分别代表特征图的通道数以及高和宽。得到通道关联矩阵,方程如下:

。其中表示通道i和j之间的关系。最终输出的特征E的计算方式为:, 其中是调整CAM权重的参数。

b:相对于CAM, Position Attention Module (PAM)用于捕获和聚合空间域中语义相关的像素。输入的特征图经过一个包含BN和ReLU的卷积层,得到B, C, D , 然后得到像素关联矩阵,其中

注意, S和X的维度是不同的,因为前者是计算N个像素之间的相关性,而前者是计算C个通道之间的相关性。PAM模块的最终输出特征图的CAM的类似。

2,多样性:正交正则化。

(此创新点来源于对SVDNet的思考)我们通过正交性来增强多样性,得到一个新的正交性正则化项。它同时适用于卷积层和全连接层的隐藏特征和权值。特征空间正交性正则化器(以下简称O.F.)是为了减少直接有利于匹配的特征之间的相关性。权值的正交正则化器鼓励滤波器的多样性和提高了学习能力。接下来,我们给出了特征空间的正交项的详细推到,而权值正交项也可以用类似的方法推到出来。对于一个特征图, 其中C、H和W分别代表特征图的通道数以及高和宽。首先将M重构成一个矩阵形式, N = H*W。当前许多的正交性方法,包括SVDNet的研究,都对权重的正交性进行了硬性约束,其计算依赖于SVD。然而, 在高维矩阵上计算奇异值分解是昂贵的,这也促进了soft正交性正则化器的发展。现有的许多soft正则化器将F的Gram矩阵近似成为一个单位矩阵,但这很难,因为F往往是不满秩的,而单位矩阵要求满秩,因此很难(但作者最后将F可视化的结果其实很近似单位阵)。什么是Gram矩阵?即矩阵分解为若干向量后,向量之间彼此做内积得到的偏心协方差矩阵。在此基础上,提出了一种基于谱归一化的正则化方法,有效的解决了这一问题。我们提出了一个新的选择,通过直接正则化的条件数来增强正交性:。其中为系数,为F的条件数,定义为最大和最小奇异值之比。常规求解需要完整的SVD。为了使其在计算上更易于处理,我们将上式转化为谱增值差的正交性正则化。, 其中分别表示的最大和最小特征值。然而, 我们用自微分法得到梯度, 这个计算仍然包含昂贵的特征值分解。为了避开特征值分解,我们参考幂次迭代法来近似特征值。我们从随机初始化开始,然后迭代执行下式:, 其中(没看懂)。这样,SVDO的计算就变得非常有效。

3,网络体系结构。

ABD-Net与最常见的特征提取骨架兼容,如ResNet、DenseNet和InceptionNet等。为了其他SOTA的方法对比,我们使用ResNet-50。我们在res_conv2的输出后添加了一个CAM和O.F.。将正则化特征图作为res_conv3的输入。接下来,在res_conv4块之后,网络并行的分成一个全局分支和一个注意力分支。我们在ResNet-50主干的所有conv层上应用O.W.,即从res_conv1到res_conv4和两个分支上的res_conv5。将两个分支的输出连接起来作为最终的特征向量。

a:注意力分支:此分支使用了和ResNet-50相同的res_conv5层。将输出的特征图输入到一个降维层,并应用O.F.生成一个更小的特征图。我们同时向CAM和PAM中输入, 两者都有O.F.约束。两个关注模块的输出和输入链接,并一起通过一个全局平均池化层,最终得到维的特征向量。

b:全局分支:此分支使用了和ResNet-50类似的res_conv5层,只是没有进行降采样。将输出的特征图送进GAP和降维层,得到了一个维的特征向量。除了注意力分支的特征,全局分支还保存了全局上下文信息。

Conclusion:

确实关注信息聚焦在变广了,但是背景信息是不是会被考虑。那就期待阿里的论文解读吧。

ABD-Net: AttentivebutDiversePersonRe-Identification论文阅读相关推荐

  1. Person Transfer GAN to Bridge Domain Gap for Person Re-Identification论文阅读

    题目 Person Transfer GAN to Bridge Domain Gap for Person Re-Identification 摘要 本文提出了一种针对于ReID的生成对抗网络PTGA ...

  2. 【论文阅读】Adaptive Clustering-based Malicious Traffic Classification at the Network Edge

    [论文阅读]Adaptive Clustering-based Malicious Traffic Classification at the Network Edge 原文标题:Adaptive Clu ...

  3. 论文阅读:Automatic Detection and Classi cation of Teeth in CT Data

    [论文信息] MICCAI 2012 会议论文 文章实现了中全自动的牙齿检测和分类,对象为CBCT/MSCT,实验数据集是43套临床头部CT图像. 主要是两个步骤: 1. 分割上颌骨: 2. 分成16 ...

  4. Long Short-Term Memory Recurrent Neural Network Architectures for Large Scale Acoustic Modeling论文阅读

    <Long Short-Term Memory Recurrent Neural Network Architectures for Large Scale Acoustic Modeling& ...

  5. 论文阅读工具ReadPaper

    对于搞科研的同学们来说,看论文是要经历的第一关,尤其是要读好多篇论文的时候,更是着实令人头大. 这不,最近无意中发现了个在线论文阅读网站:readpaper.com,号称「论文阅读笔记神器,硕博科研学 ...

  6. 多目标跟踪:CVPR2019论文阅读

    多目标跟踪:CVPR2019论文阅读 Robust Multi-Modality Multi-Object Tracking 论文链接:https://arxiv.org/abs/1909.03850 ...

  7. 快速人体姿态估计:CVPR2019论文阅读

    快速人体姿态估计:CVPR2019论文阅读 Fast Human Pose Estimation 论文链接: http://openaccess.thecvf.com/content_CVPR_201 ...

  8. Action4D:人群和杂物中的在线动作识别:CVPR209论文阅读

    Action4D:人群和杂物中的在线动作识别:CVPR209论文阅读 Action4D: Online Action Recognition in the Crowd and Clutter 论文链接 ...

  9. 深度学习点云语义分割:CVPR2019论文阅读

    深度学习点云语义分割:CVPR2019论文阅读 Point Cloud Oversegmentation with Graph-Structured Deep Metric Learning 摘要 本 ...

最新文章

  1. 屏蔽机房设计时需要注意什么 ?如何更好维护使用屏蔽机房?
  2. VQEG(视频质量专家组)
  3. 视频API的发展方向
  4. python 插补数据_python 2020中缺少数据插补技术的快速指南
  5. 【水】uva10037 过桥
  6. ai python 代码提示插件_Python 还能实现哪些 AI 游戏?附上代码一起来一把!
  7. ASP.NET:判断session是否合法示例
  8. 干部身份、三方协议、派遣证(转)
  9. 零基础怎么学好3D建模?只需要了解下面几点
  10. WPS如何用Excel制作甘特图
  11. 【使用zookpeer】模拟 hadoop的 datenode与namenode 的master-slaves的 关系
  12. 14个PPT资源素材网站,再也不怕做PPT了
  13. android 通知历史,如何查看已随指尖划走的那些通知 -- Past Notifications #Android
  14. 优秀网页翻译:DS3231与 PCF2129 RTC比较
  15. 前端页面渲染markDown文件
  16. 详解容灾架构中的数据复制技术
  17. tidb-tso与标准时间相互转换
  18. 部署企业版lync2013之四:持久聊天
  19. 第14周---温湿度传感器采集
  20. Stata:用交互项做分组回归,结果如何分析

热门文章

  1. android动画制作工具,一款非常好用的动画库Lottie
  2. AMBER“FATAL: Atom .R<SEP 552>.A<N 1> does not have a type.“
  3. 收集整理的ARM嵌入式linux开发入门视频教程
  4. linux环境下从路径字符串中截取目录和文件名信息
  5. 苹果手机home键在哪里_苹果手机为什么没有返回键? 原来隐藏着更好的方法, 涨知识了...
  6. 美颜SDK多少钱一年?视频美颜SDK的价格由哪些因素影响?
  7. exchange外网访问和证书配置
  8. sql语句查询某天、某周、某月、某年的数据
  9. 华为防火墙NAT策略
  10. 华为防火墙实现双机热备配置详解