谢邀。一年前的这个时候,梳理过Attention的相关工作,Attention可以从多个角度上进行认识:

1. 首先是Object Recognition。我是从Recurrent Model of Visual Attention (RAM)开始关注Attention的,作者是DeepMind 的Mnih (Hinton高徒),加上后面他的师弟Jimmy在DeepMind 实习期间发的这个工作的后续Multiple Object Recognition with Visual Attention(DRAM),都是比较有趣的工作。说其有趣,是因为模型结合了CNN,RNN 和 Reinforcement Learning,来解决问题。值得注意的是,这两篇文章属于提出新思路,实验都只是在变换的MNIST上做的,放在实际场景数据集上未必work(我出于兴趣复现了tf版的DRAM,并且在其上对它进行很大程度了改进,并引入了weakly supervised的因素,虽在变换的MNIST上表现很好,后面我尝试过拿他来在现实场景的datasets上做实验,但是效果不好;也尝试了拿它做车辆的细粒度分类,同样没有直接拿一个 CNN 效果好(可能是我太不才,求交流))。跟前两篇方法类似,用attention来做图像生成,如DRAW: A Recurrent Neural Network For Image Generation 来序列地生成数字。

2. 然后是Image Caption。Xu在ICML上的 Show, Attend and Tell: Neural Image Caption Generation with Visual Attention可谓应用Attetion来解image caption的经典。该文中也总结出Soft attention 和 Hard attention。soft是拿deterministic的分布作为权重进行加权,hard是从分布上stochastic 采样。这类工作也是用RNN逐渐进行处理的。

3. NLP中的Machine Translation. 前面的工作都是用时序地进行Attention来关注一幅图像的不同位置区域。类比sequence问题,也就顺理成章地用在Machine Translation上了,同样是时序的关注不同历史特征来出每一个翻译词汇。Attention用在Machine Translation上的文章很多,具体可关注Bengio组的工作,比如neural machine translation。

4. 不使用RNN结构。在特征图上生成空间分布的权重,然后再对特征图加权求和,试图让网络学出来对不同物体区域加以不同关注度。之后的在CV领域中应用attention绝大多数都是这么干的。例如,spatial transformer networks(STN)是之后将attention用于物体识别比较有名的一篇文章,在一些现实应用中仍被使用。再如residual attention network.

5. 总结与泛化。划重点:attention机制听起来高达上,其实就是学出一个权重分布,再拿这个权重分布施加在原来的特征之上,就可以叫做attention。简单来说:

(1)这个加权可以是保留所有分量均做加权(即soft attention);也可以是在分布中以某种采样策略选取部分分量(即hard attention)。

(2)这个加权可以作用在原图上,也就是RAM和DRAM;也可以作用在特征图上,如后续的好多文章(例如image caption)。

(3)这个加权可以作用在空间尺度上,给不同空间区域加权;也可以作用在channel尺度上,给不同通道特征加权;甚至特征图上每个元素加权。

(4)这个加权还可以作用在不同时刻历史特征上,如Machine Translation,以及我前段时间做的视频相关的工作。

所以说,Attention是啥啊?不就是一个权重分布嘛,搞得玄乎其玄~

Attention的相关工作相关推荐

  1. 超大规模智能模型相关工作总结:编程实现框架、算法模型、微调技术和应用...

    ©PaperWeekly 原创 · 作者 | 金金 单位 | 阿里巴巴研究实习生 研究方向 | 推荐系统 简介 近日,超大规模的智能模型越来越受到大家的关注,但是仅仅依赖于超大的计算资源并不足以完成这 ...

  2. 拼多多成立技术顾问委员会,陆奇将领导相关工作

    整理 | 琥珀 出品 | AI科技大本营(公众号id:rgznai100) 美国东部时间 3 月 13 日上午,拼多多(NASDAQ:PDD)公布了截止 2018 年 12 月 31 日的第四季度和全 ...

  3. 逐飞关于第15届智能车竞赛相关工作

    卓老师您好: 昨天从卓老师微信公众号的推文里得知今年的比赛终于要办了,虽然我已不参加比赛,但依然很开心.一是因为自己的确希望大赛能在困难之中继续前进,这一部分的确是对智能车竞赛的热爱:二是比赛还在的话 ...

  4. FCN全连接卷积网络(5)--Fully Convolutional Networks for Semantic Segmentation阅读(相关工作部分)

    相关工作 相关工作 1.重新设计和微调现有的分类模型来指导语义分割的密集预测内容. 2.虽然进去已有研究团队将卷积网络应用到密集预测任务当中,但是这些方面存在着一些不足,入感知范围有限.需要传统方法进 ...

  5. 自然语言处理技术(NLP)在推荐系统中的应用 原2017.06.29人工智能头条 作者: 张相於,58集团算法架构师,转转搜索推荐部负责人,负责搜索、推荐以及算法相关工作。多年来主要从事推荐系统以及机

    自然语言处理技术(NLP)在推荐系统中的应用 原2017.06.29人工智能头条 作者: 张相於,58集团算法架构师,转转搜索推荐部负责人,负责搜索.推荐以及算法相关工作.多年来主要从事推荐系统以及机 ...

  6. 微软内部文件:Longhorn相关工作外包印度

    一个劳工团体透露,微软公司将下一代操作系统的部分工作外包给印度公司. 科技业劳工组织WashTech 28 日表示,该组织取得的微软内部文件显示,至少有两家印度的海外公司正在进行下一代操作系统,代号& ...

  7. 阿里云官方学习课程推荐-Linux运维学习路线 从事云计算运维相关工作必备技能

    阿里云官方学习课程推荐-Linux运维学习路线 从事云计算运维相关工作必备技能 目前越来越多的企业需要依赖于IT技术发布产品与服务,尤其是电子商务最为明显,它凸显了IT技术在现代企业中的重要性.当企业 ...

  8. Vue项目流程7,交易页面,提交订单,支付页面,利用element UI 以及 QRCode 完成微信支付,弹出框按钮的相关工作,个人中心以及子路由我的订单

    目录 交易页面 提交订单 支付页面 微信支付 个人中心 我的订单 交易页面 1.静态组件及路由跳转 2.获取交易页数据 (1)接口 //获取用户地址信息 地址:/api/user/userAddres ...

  9. RFSoC应用笔记 - RF数据转换器 -22- API使用指南之配置DAC相关工作状态和中断相关函数使用

    前言 本文完结后,关于RFSoC的配置的API函数部分就全部介绍完毕,后续有空将更新介绍简单的射频收发回环示例工程,不定时更新,敬请期待. 配置DAC相关工作状态 XRFdc_SetInterpola ...

最新文章

  1. 011:视图函数介绍
  2. jQuery中$(document).ready()和window.onload的区别
  3. python css selector_Python爬虫之Selector的用法
  4. ActiveMQ中的温度,存储和内存使用百分比
  5. HTML5 webfont字体图标的使用
  6. python 函数图解_Python函数说明(一)
  7. gifrecord可以卸载吗_频繁安装卸载 App,手机真能受得了吗?!
  8. day11--Matplotlib--柱形图与盒图
  9. Axure模板库(1)-常见网站
  10. 网页保存为PDF遇到的问题(网页打印)
  11. 北京python培训班价格
  12. Java控制无人机程序_深入了解ROS之编写无人机控制程序包
  13. 基于Core Text实现的TXT电子书阅读器
  14. “微信之父”张小龙首次演讲实录:详解微信平台四大价值观
  15. 利用MODIS TOOL批量重投影MODIS
  16. ORACLE 增删改查与更新
  17. 按键精灵免字库本地识别OCR
  18. 802.11a/g/n下子载波数量、子载波间隔、数据速率的相关问题
  19. 疯狂Java讲义(九)
  20. 给新手学习MySQL的建议

热门文章

  1. mysql回滚用法_Mysql误操作后利用binlog2sql快速回滚的方法详解
  2. 简书mysql配置_MySQL安装配置
  3. ps图片边缘淡化接近背景色_7招让你抠图不再犯愁之PS抠图技巧大合集!
  4. 算术表达式求解背景_1.8 C++算术运算符与表达式
  5. php带帽接口_利用php自包含特性上传webshell
  6. 前端遍历列表生成表格_源码剖析狗屁不通文章生成器
  7. 阿里技术人的第一节课
  8. 55.npm install 报错 :stack Error: Can't find Python executable python
  9. NodeJS中的循环陷阱
  10. OpenCASCADE Make Primitives-Sphere