本文主要总结了最新的关于attention的应用文章。

Attention-based Dropout Layer for Weakly Supervised Object Localization(CVPR19)

任务:弱监督的物体定位:只给定图像类别的标签,要求定位出目标所在的区域。

动机:只给定物体类别的话,网络往往只关注最具有判别性的信息,无法挖掘到整个物体信息。能否设计一种drop操作,每次迭代时drop最具判别性的信息,强迫网络关注其他的区域?

做法:代替之前采用CAM得到特征的热力图,模型使用(channel-wise pooling)直接生成热力图。采用一个设定的阈值,得到一个drop mask。

Visual Attention Consistency under Image Transforms for Multi-Label Image Classification (CVPR19)

任务:多标签图像分类问题

动机:数据增广被广泛用于图像分类任务,但是数据增广存在缺陷。图像的一些变换(如旋转)应该是比较渐层能学习到的,但是在一般使用数据增广的策略中,都只是使用最后loss来对这种变换进行学习。能否对数据增广学到的特征图进行约束。

方法:采用两分支结构。输入原始图像I和转换后的图像T(I),利用CAM得到两个特征图的热力图,约束I的热力图经过T的转换后与T(I)的热力图相同。即图像数据增广后仍然关注同样部件的区域。

AttPool: Towards Hierarchical Feature Representation in Graph Convolutional Networks via Attention Mechanism (ICCV19)

任务:定义了一个graph pooling操作。

方法:对于一个有N个节点的图(N,D),首先预测每个节点的得分(N),然后选择前K个节点(K,D),对这K个节点利用全部的N个节点进行更新(GCN)。

问题:和之前的文章Self-Attention Graph Pooling思想和做法很像,加了一步更新操作。

Group-wise Deep Object Co-Segmentation with Co-Attention Recurrent Neural Network (ICCV19)

任务:图像组间的共有物体的定位。

做法:设计了类似GRU的单元,设定了更新门和重置门,不断的更新隐单元g,使其融入了所有图像的信息,然后返回来指导每个图像的预测生成。

End-to-End Multi-Task Learning with Attention

任务:多任务学习

动机:对于多任务学习,应该有任务共享的特征和任务特定的特征。对于任务共享的特征可以通过在所有任务上学习得到。那么如何得到任务特定的特征呢?

方法:对于每个任务学习一个attention,作为特征选择器,选择与该任务相关的特征。

See More, Know More: Unsupervised Video Object Segmentation with Co-Attention Siamese Networks (CVPR19)

任务:无监督的视频物体分割

做法:提出了一个co-attention模块,将相邻帧对齐,并将F1(F2)帧的信息整合到F2(F1)上。

问题:用在视频reID上,相邻帧进行对齐后,再进行特征整合。

Improving Referring Expression Grounding with Cross-modal Attention-guided Erasing (CVPR19)

任务:跨模态的检索。给定一个语句描述,检索出图像的那个框是与之对应的。

动机:图像与语句之中可能存在多个对应关系,但是现有方法往往会过多的关注最具有判别性的对应关系。能否有一种机制,迫使网络可以关注更多的对应关系。

做法:擦除最具有判别性的语句或者图像区域。

Cross-Modal Self-Attention Network for Referring Image Segmentation

任务:跨模态分割,给定一个语句描述,分割出图像对应的物体区域。

做法:设计了一个扩模态的self attention机制,即对于query,key, value融入了图像特征和语句特征。

Mask-Guided Attention Network for Occluded Pedestrian Detection (ICCV19)

任务:遮挡的行人检测

做法:遮挡会对行人检测的性能产生较大的影响。对于特征,生成一个空间mask,mask掉遮挡区域的特征。利用可见的bounding box监督mask的生成。

Looking for the Devil in the Details: Learning Trilinear Attention Sampling Network for Fine-grained Image Recognition (CVPR)

动机:如何自适应地并且无监督的定位出物体各个部件的区域。每个channel可以响应一个特定的物体,但是单个channel的噪声大。能否整合channel使其可以定位出目标物体

做法:利用self-attention的思想,加强每个channel的特征。X为(C,N)  .此时每个channel可以看做一个空间注意力图,对应一个指定的部件。

发布于 2020-04-14

Attention最新进展相关推荐

  1. 一文详述Attention最新进展

    关注上方"深度学习技术前沿",选择"星标公众号", 资源干货,第一时间送达! 作者:sisiyou 知乎链接:https://zhuanlan.zhihu.co ...

  2. 2019最新进展 | Transformer在深度推荐系统中的应用

    作者 | Alex-zhai 来源 | 深度传送门(ID:deep_deliver) [导读]最近基于Transformer的一些NLP模型很火(比如BERT,GPT-2等),因此将Transform ...

  3. 深度CTR预估模型的演化之路2019最新进展

    作者 | 锅逗逗 来源 | 深度传送门(ID: deep_deliver) 导读:本文主要介绍深度CTR经典预估模型的演化之路以及在2019工业界的最新进展. 介绍 在计算广告和推荐系统中,点击率(C ...

  4. transformer预测过程_2019最新进展 | Transformer在深度推荐系统中的应用

    作者 | Alex-zhai 来源 | 深度传送门(ID:deep_deliver) [导读]最近基于Transformer的一些NLP模型很火(比如BERT,GPT-2等),因此将Transform ...

  5. 《预训练周刊》第28期:M6-10T:高效多万亿参数预训练的共享去链接范式、大模型自然语言处理的最新进展综述...

    No.28 智源社区 预训练组 预 训 练 研究 观点 资源 活动 关于周刊 本期周刊,我们选择了11篇预训练相关的论文,涉及模型训练.图像编码.气候文本.对比学习.文本生成评估.小样本学习.决策推理 ...

  6. AAAI 2021最佳论文《Informer》作者:Transformer 最新进展

    作者:周号益,彭杰奇 单位:北京航空航天大学 自2017年,Ashish Vaswani等人在<Attention Is All You Need>这篇文章种提出了Transformer模 ...

  7. AAAI 2021 | 情感分析最新进展解读

    图片来源:网络 作者:陆鑫,赵妍妍,秦兵 单位:哈尔滨工业大学 情感分析是自然语言处理中的一个重要研究领域,其相关应用在各种真实场景中发挥着重要作用. 近年来,基于深度学习的方法逐渐成为情感分析的主流 ...

  8. AAAI2021 | 图神经网络最新进展解读

    作者:纪厚业,北京邮电大学,智源 AAAI预讲会讲者 近年来,图神经网络(GNN,Graph Neural Network)逐渐成为人工智能领域的一大热门领域.GNN的一大优势是能够使各个领域(不仅仅 ...

  9. Transformer在深度推荐系统中的应用及2019最新进展

    作者:Alex-zhai 来源:https://zhuanlan.zhihu.com/ p/85825460 整理:深度传送门 最近基于Transformer的一些NLP模型很火(比如BERT,GPT ...

最新文章

  1. python3默认编码格式_python3 中文乱码与默认编码格式设定方法
  2. linux apache 负载均衡,使用Apache作为前端负载均衡器
  3. 【CV】深度了解自监督学习,就看这篇解读 !SimMIM:掩码图像建模的简单框架...
  4. es 指定排序字段_ES里多字段分组后排序
  5. C#学习笔记——读写ini文件
  6. Mysql5.5部署MHA
  7. 块设备驱动之NAND FLASH驱动程序
  8. 可以使用中文作为变量名_次氯酸可以作为伤口消毒使用吗?
  9. 流畅的python第一章_《流畅的Python》第一章学习笔记
  10. WCF+EF实战系列一
  11. CCF201609-1 最大波动
  12. 【Spark】Spark 报错 error writing stream metadata exitcode=1073741515
  13. java给视频添加水印_用java实现给图片增加图片水印或者文字水印(也支持视频图像帧添加水印)...
  14. Crontab cron.deny cron.allow
  15. 修改才是写作的本质所在
  16. echart2文档(简单明白)
  17. 3-Coloring(奇偶涂色)
  18. JavaScript网页特效范例宝典pdf
  19. Android浮窗权限判断
  20. 【信息学奥赛一本通】1134:合法C标识符查

热门文章

  1. 2021.4.11 字节跳动实习笔试题---情报解密
  2. 键盘历史记录实用程序已停止工作 解决办法
  3. python打印日志
  4. BERT各个场景实例代码
  5. EM算法 大白话讲解 没看懂 保存
  6. 《预训练周刊》第39期: 深度模型、提示学习
  7. 以不变应万变:因果启发的稳定学习年度研究进展(下篇)
  8. 智源「高能对撞粒子分类挑战赛」开启,品鉴宇宙粒子的独特味道
  9. 图灵2011年6月书讯【误区】【软件调试修炼之道】即将上市
  10. window.open() document.open()