来源:https://zhuanlan.zhihu.com/

p/130388873

作者:一块小蛋糕
编辑:深度传送门

本文主要总结了最新的关于attention的应用文章。

Attention-based Dropout Layer for Weakly Supervised Object Localization(CVPR19)

任务:弱监督的物体定位:只给定图像类别的标签,要求定位出目标所在的区域。

动机:只给定物体类别的话,网络往往只关注最具有判别性的信息,无法挖掘到整个物体信息。能否设计一种drop操作,每次迭代时drop最具判别性的信息,强迫网络关注其他的区域?

做法:代替之前采用CAM得到特征的热力图,模型使用(channel-wise pooling)直接生成热力图。采用一个设定的阈值,得到一个drop mask。

Visual Attention Consistency under Image Transforms for Multi-Label Image Classification (CVPR19)

任务:多标签图像分类问题

动机:数据增广被广泛用于图像分类任务,但是数据增广存在缺陷。图像的一些变换(如旋转)应该是比较渐层能学习到的,但是在一般使用数据增广的策略中,都只是使用最后loss来对这种变换进行学习。能否对数据增广学到的特征图进行约束。

方法:采用两分支结构。输入原始图像I和转换后的图像T(I),利用CAM得到两个特征图的热力图,约束I的热力图经过T的转换后与T(I)的热力图相同。即图像数据增广后仍然关注同样部件的区域。

AttPool: Towards Hierarchical Feature Representation in Graph Convolutional Networks via Attention Mechanism (ICCV19)

任务:定义了一个graph pooling操作。

方法:对于一个有N个节点的图(N,D),首先预测每个节点的得分(N),然后选择前K个节点(K,D),对这K个节点利用全部的N个节点进行更新(GCN)。

问题:和之前的文章Self-Attention Graph Pooling思想和做法很像,加了一步更新操作。

Group-wise Deep Object Co-Segmentation with Co-Attention Recurrent Neural Network (ICCV19)

任务:图像组间的共有物体的定位。

做法:设计了类似GRU的单元,设定了更新门和重置门,不断的更新隐单元g,使其融入了所有图像的信息,然后返回来指导每个图像的预测生成。

End-to-End Multi-Task Learning with Attention

任务:多任务学习

动机:对于多任务学习,应该有任务共享的特征和任务特定的特征。对于任务共享的特征可以通过在所有任务上学习得到。那么如何得到任务特定的特征呢?

方法:对于每个任务学习一个attention,作为特征选择器,选择与该任务相关的特征。

See More, Know More: Unsupervised Video Object Segmentation with Co-Attention Siamese Networks (CVPR19)

任务:无监督的视频物体分割

做法:提出了一个co-attention模块,将相邻帧对齐,并将F1(F2)帧的信息整合到F2(F1)上。

问题:用在视频reID上,相邻帧进行对齐后,再进行特征整合。

Improving Referring Expression Grounding with Cross-modal Attention-guided Erasing (CVPR19)

任务:跨模态的检索。给定一个语句描述,检索出图像的那个框是与之对应的。

动机:图像与语句之中可能存在多个对应关系,但是现有方法往往会过多的关注最具有判别性的对应关系。能否有一种机制,迫使网络可以关注更多的对应关系。

做法:擦除最具有判别性的语句或者图像区域。

Cross-Modal Self-Attention Network for Referring Image Segmentation

任务:跨模态分割,给定一个语句描述,分割出图像对应的物体区域。

做法:设计了一个扩模态的self attention机制,即对于query,key, value融入了图像特征和语句特征。

Mask-Guided Attention Network for Occluded Pedestrian Detection (ICCV19)

任务:遮挡的行人检测

做法:遮挡会对行人检测的性能产生较大的影响。对于特征,生成一个空间mask,mask掉遮挡区域的特征。利用可见的bounding box监督mask的生成。

Looking for the Devil in the Details: Learning Trilinear Attention Sampling Network for Fine-grained Image Recognition (CVPR)

动机:如何自适应地并且无监督的定位出物体各个部件的区域。每个channel可以响应一个特定的物体,但是单个channel的噪声大。能否整合channel使其可以定位出目标物体

做法:利用self-attention的思想,加强每个channel的特征。X为(C,N)  .此时每个channel可以看做一个空间注意力图,对应一个指定的部件。

往期精彩回顾适合初学者入门人工智能的路线及资料下载机器学习及深度学习笔记等资料打印机器学习在线手册深度学习笔记专辑AI基础下载(pdf更新到25集)机器学习的数学基础专辑本站qq群1003271085,加入微信群请回复“加群”获取一折本站知识星球优惠券,复制链接直接打开:https://t.zsxq.com/yFQV7am喜欢文章,点个在看

Attention技术应用的最新进展概述相关推荐

  1. 最新进展概述:澄清式提问辅助理解信息检索中的用户意图

    ©PaperWeekly 原创 · 作者|金金 单位|阿里巴巴研究实习生 研究方向|推荐系统 用户使用搜索引擎的过程中,通常很难用单一的查询表达复杂的信息需求.在真实应用的过程中,用户需要根据当前搜索 ...

  2. 阿里粗排技术体系与最新进展

    分享嘉宾:王哲 阿里巴巴 编辑整理:乐远 出品平台:DataFunTalk 导读:在搜索.推荐.广告等需要进行大规模排序的场景,级联排序架构得到了非常广泛的应用.以阿里的在线广告系统为例,按顺序一般包 ...

  3. qPCR技术发展史及最新进展

    推荐阅读: 造血干细胞扩增.转染以及基因编辑优化解决方案 T细胞培养技术进展及解决方案 PCR技术自从1985年由Mullis发明以来,被广泛的应用到核酸分子的检测当中.但显然,只能定性分析而无法定量 ...

  4. 第一届大数据科学与工程国际会议,聚焦国际大数据技术最新进展

    第一届大数据科学与工程国际会议(2016)(THE 1ST INTERNATIONAL CONFERENCE ON BIG DATA SCIENCE AND ENGINEERING(BDSE2016) ...

  5. 2022业界广告推荐技术最新进展与趋势:阿里、腾讯、字节、微软

    猜你喜欢 0.淘宝首页猜你喜欢推荐建模实践 1.[免费下载]2022年8月份热门报告 2.[实践]小红书推荐中台实践 3.微信视频号实时推荐技术架构分享 4.对比学习在宽狩推荐系统中的应用实践 5.微 ...

  6. V神以太坊:Casper 权益证明与分片技术最新进展

    V神以太坊:Casper 权益证明与分片技术最新进展 原创: 卢凯 区块链大本营 昨天 2018年6月3日,由全球最大开发者社区CSDN和专注以太坊生态建设的领先企业灵钛科技主办,以太坊爱好者社区.柏 ...

  7. Vitalik Buterin:Casper 权益证明与分片技术最新进展

    2018年6月3日,由全球最大开发者社区CSDN和专注以太坊生态建设的领先企业灵钛科技主办,以太坊爱好者社区.柏链道捷.火星财经.金色财经.Unitimes.区块链大本营协办的"2018以太 ...

  8. 2022 智能语音技术最新进展与发展趋势

    在深度学习.大数据和大算力的推动下,以语音增强.识别和合成为代表的智能语音技术已经在众多应用中落地.特为大家整理了一些比较前沿的报告,文末可免费获取. No.1 智能语音技术新进展与发展趋势 主讲人: ...

  9. V神北京演讲全文:Casper与分片技术的最新进展

    6月3日,2018以太坊技术及应用大会在京召开,以太坊创始人Vitalik Buterin出席大会并在演讲中分享了Casper与分片技术的最新进展. 在提及二次分片时,V神称假设一个节点能处理N个交易 ...

最新文章

  1. 代码的演化-DI(理解依赖注入di,控制反转ioc)
  2. Hierarchical Attention Networks for Document Classification(HAN)
  3. MybatisPlus入门之快速入门
  4. TortoiseGit 修改密码
  5. 刚入行的UI设计师,通过临摹优秀UI KIT作品开始
  6. java 风能玫瑰图_使用java awt画风向玫瑰图及风能玫瑰图程序
  7. 非科班生的Android秋招求职经历
  8. 计算机键盘不能用怎么办,电脑键盘空格键失灵无法使用怎么办|电脑键盘空格键失灵的解决方法...
  9. PHP对接苹果支付全流程
  10. python面向对象实例王者荣耀_用python的requests第三方模块抓取王者荣耀所有英雄的皮肤实例...
  11. 阿里云香港服务器被攻击进黑洞了怎么办
  12. 初学EGE图形库(零)---从零开始CodeBlocks安装配置使用EGE图形库
  13. CAD数据导入数据库
  14. 基于QT的商场线上购物管理系统之客户端
  15. 2015_12_27微软校园招聘笔试题目
  16. 一篇文章详细介绍什么是回调地狱
  17. 中科创达 面试题目合集(2021.8)
  18. 【Bug】HTC Vive Pro连接电脑后,一带在头上就会发生卡顿现象,头盔内白屏,信号丢失
  19. UE4纯蓝图添加C++遇到的一个坑
  20. 计算机如何打开无线网络适配器,电脑WIFI网络适配器卡怎么启用

热门文章

  1. 把AspDotNetCoreMvc程序运行在Docker上-part2:修改容器以及发布镜像
  2. weblogic线程阻塞性能调优(图解)转
  3. Logger日志级别说明及设置方法、说明 (zhuan)
  4. Unobtrusive Ajax
  5. C# 连接Oracle(利用ODP.net,不安装oracle客户端)
  6. 5种较为简单的缺失值处理方法
  7. MacOS Big Sur软件打开“您没有权限打开应用程序”解决办法
  8. 通过相似性或相异指数的数值分布比较群落Beta多样性高低
  9. SqlServer 增加字段,修改字段名,删除字段,修改字段默认值
  10. CAD 2021安装教程(超简单)