目录

  • HA-CNN
    • 1.总布局
    • 2.HA模块
    • 3.HA-CNN网络总分析
    • 4.Cross-Attention Interaction
  • 实验分析
  • 启发

说明:网络上关于论文的描述是挺多的,但是只从论文表面很难的透彻,所以本文从网络出发,可以更好的理解HA-CNN,如果有错,欢迎指出,感谢!
论文贡献点:

  1. HA-CNN
  2. 交叉注意交互学习机制,以进一步提高注意选择和特征表示之间的相容性。

HA-CNN

1.总布局

  1. 全局分支(+soft attention),目的是从整个图像中学习最优的整体特征。
  2. 局部分支包含了4个直流,每个支流的目的是学习图片的一个局部区域

2.HA模块

上图红色的HA模块有两个输出,一个是soft attention,一个是hard attention。
soft attention(包括空间注意力、通道注意力)软注意学习的目的是选择细粒度的重要像素点,它们是pixel级。
hard attention( local 注意力)硬注意学习则致力于搜索粗糙的潜在判别区域,它们是region级。
他们在功能上有很大的互补性。他们的结合使用可以提高模型的性能

软、硬注意力生成图

3.HA-CNN网络总分析

4.Cross-Attention Interaction

以下是对于HA-CNN图中的加号处描述
考虑了一种交叉注意交互机制,通过跨分支参与的局部和全局特征的交互来丰富他们的联合学习和谐。通过这样做,我们可以同时降低局部分支的复杂性(较少的层),因为全局分支的学习能力可以部分共享。


公式描述(需要结合我上面手绘图,–>表示经过):
1:初始图片–>HA1处的STN–>d1得到的一个local
2:是经过HA1后的图片–>HA2处的STN得到的一个local
3:两个local图的和(也就是HA-CNN图中加号的描述)
将3经过d2后就得到了local2的特征

实验分析

  1. 硬注意力(local)提升较高
  2. Cross-Attention Interaction(红色加号的操作)影响确实很大
  3. HA-CNN模型很小

启发

1. 三个不同的HA,且层层递进(让HA输出的soft attention 和hard attention都在渐进式学习)

解释:
根据HA-CNN图来看,共有3个HA, 每个HA模块都经过了专门的优化(具体指的是经过d1,d2,d3三个不同的inception生成三个HA),以单独处理其自身级别的输入特性表示。在CNN分层框架中,这自然允许分层的多层次注意力学习,以分而治之的设计精神逐步完善注意力地图。可以显著减少注意搜索空间(即模型优化的复杂性),同时允许多尺度的层次特征选择性来丰富最终的特征表示。这种渐进的整体注意力模型对于人的识别来说既直观又重要。

2. Cross-Attention Interaction

解释:
这一部分是对于局部分支的操作,一个local的生成由局部分支的local和全局分支的local相加得到。**全局分支local的描述:**因为一张图片经过HA1后便有了注意力,HA2产生stn参数,作用到有注意力的图片上,则说明得到的local是经过全局注意力洗礼过的。
所以两个local相加的特征会更好。

从网络出发讲透Harmonious Attention Network for Person Re-Identification你不懂的细节相关推荐

  1. 【ReID】Harmonious Attention Network for Person Re-Identification

    [ReID]Harmonious Attention Network for Person Re-Identification 模型 实验 写作 问题 参考文献 阅读了Harmonious Atten ...

  2. Harmonious Attention Network for Person Re-Identification

    Harmonious Attention Network for Person Re-Identification 1.介绍 2.作者的方法 3.实验细节 4.实验结果 1.介绍 现有的行人重识别算法 ...

  3. 【注意力模型】Harmonious Attention Network for Person Re-Identification

    文章目录 Abstract 1 Introduction 2 Related Work 3 Harmonious Attention Network 3.1 Harmonious Attention ...

  4. 2018-CVPR-Harmonious Attention Network for Person Re-Identification

    论文地址 代码实现[Pytorch] Motivation 对于大幅度的姿势变化以及错检带来的行人框对准问题,现有方法采用constrained attention selection mechani ...

  5. 【论文阅读】Hierarchical Multi-modal Contextual Attention Network for Fake News Detection --- 虚假新闻检测,多模态

    本博客系本人阅读该论文后根据自己理解所写,非逐句翻译,欲深入了解该论文,请参阅原文. 论文标题:Hierarchical Multi-modal Contextual Attention Networ ...

  6. Focusing Attention Network(FAN)自然图像文本识别 学习笔记

    Focusing Attention: Towards Accurate Text Recognition in Natural Images Author: Zhanzhan Cheng,Fan B ...

  7. Heterogeneous Edge-Enhanced Graph Attention Network For Multi-Agent Trajectory Prediction(HEATConv)

    Heterogeneous Edge-Enhanced Graph Attention Network For Multi-Agent Trajectory Prediction(HEATConv) ...

  8. 图注意力网络(Graph Attention Network, GAT) 模型解读与代码实现(tensorflow2.0)

    前面的文章,我们讲解了图神经网络三剑客GCN.GraphSAGE.GAT中的两个: 图卷积神经网络(GCN)理解与tensorflow2.0代码实现 GraphSAGE 模型解读与tensorflow ...

  9. HAN - Heterogeneous Graph Attention Network 异构图注意力网络 WWW2019

    论文题目:Heterogeneous Graph Attention Network (HAN)异构图注意力网络 作者:北京邮电大学Xiao Wang,Houye Ji等人 来源:WWW2019 论文 ...

最新文章

  1. /usr/bin/ld: cannot find -lmysqlclient_r
  2. 服务器怎么虚拟化内存,服务器虚拟化内存大小
  3. patience counts
  4. AAAI 独家 | 腾讯AI Lab 现场陈述论文:使众包配对排名聚合信息最大化的 HodgeRank
  5. MyBatis 多表联合查询及优化
  6. AI时代的交换机什么样?华为CloudEngine 16800告诉你!
  7. python爬虫外快_我用Python爬虫挣钱的那些事
  8. HexorBase 登陆、执行语句、数据库帐号密码破解
  9. oracle创建目录并赋权,Oracle 添加用户并赋权,修改密码,解锁,删除用户的方法...
  10. 【Java数据结构与算法】第五章 递归、迷宫回溯和八皇后问题
  11. 第一:Python安装需要的第三方库时,命令行输入pip提示不是内部或外部命令
  12. mysql——leetcode问题记录
  13. ubuntu国内镜像站点及更新源
  14. c#中使用BackgroundWorker
  15. r语言如何计算t分布临界值_第十二讲 R-配对样本t检验
  16. 南通全国计算机等级考试,南通大学2017年3月全国计算机等级考试报名通知
  17. mysql的查询分析工具下载_万能数据库查询分析器(ODBC数据库查询分析工具)V7.03 最新版...
  18. 计算机网络期末复习资料(一)单选题
  19. 软件测试的正向思维,反向思维
  20. arduino学习笔记二十二--模拟交通信号灯

热门文章

  1. 数仓和数据中台长期霸权,数据湖最稳
  2. 花书——PyTorch版本
  3. ug钣金冲压成型--混合折弯
  4. HDU-6447-YJJ's Salesman(离散化+01dp,线段树维护)
  5. Win11调整分区大小的方法有哪些?
  6. 升级glibc-2.12到glibc-2.15的正确方式
  7. HyperLynx(八)带状线串扰的仿真
  8. opporeno5k怎样关闭乐划锁屏锁屏杂志
  9. DEPICT实现基因优化(gene prioritization)、gene set富集分析(geneset enrichment)、组织富集分析(tissue enrichment)...
  10. postgis对矢量进行切片(更新中)