在机器翻译、图像识别等任务上表现SOTA!性能优于Performer、ViT和Transformer-XL等网络。

作者单位:谷歌Research和大脑团队等
论文:https://arxiv.org/pdf/2103.01075.pdf

本文提出了来自Transformer的全方位表示(OmniNet)。

在OmniNet中,不是维护严格的水平感受野,而是允许每个token都参与整个网络中的所有token。此过程也可以解释为一种极端或集中注意力机制的形式,该机制具有网络整个宽度和深度的感受野。

为此,通过元学习器来学习全向注意力,这实质上是另一个基于自注意力的模型。为了减轻完整的感受野注意力的计算成本,我们利用有效的自注意力模型,例如基于kernel的(Choromanski等人),low-rank的注意力(Wang等人)和/或Big Bird(Zaheer)等)。

Transformer架构

Transformer块接受N×d输入,其中N表示序列中标记的数量,d表示表示的大小。每个Transformer模块都具有一个自我注意模块和一个两层前馈网络,在它们之间以位置方式应用ReLU激活。

自我注意机制首先使用线性变换将每个输入X投影到Q,K,V表示形式中,这些形式对应于查询,键和值。自我注意机制通常是多头的,其中并行执行多个相似的线性投影。第l层中每个自我关注头h的输出写为:

其中yh,l是头h在第l层的输出,而dk是每个头的大小。然后,将多个磁头的输出进行级联,然后通过Wo,l进行另一个线性变换,该变换将所有磁头的级联投影到dm。这是通过层归一化和残差连接来包装的,可以写为:

作为self- 注意模块。

Feed Forward Layers 变压器块的FFN块执行两层转换,定义为:

其中W1,W2是FFN层的可训练参数(权重变换)。为了清楚起见,省略了偏置参数。

OmniNet网络细节(建议看原文第三章3.2)

  1. 提名代表

  2. 保持因果关系和自动回归解码

  3. 高效变压器

  4. 分区的单子网络

实验结果

在自回归语言建模(LM1B,C4),机器翻译, Long Range Arena(LRA)和图像识别方面进行了广泛的实验。实验表明,OmniNet在这些任务上实现了相当大的改进,包括在LM1B,WMT'14 En-De / En-Fr和 Long Range Arena上实现了最先进的性能。

此外,在Vision Transformers中使用全向表示可以显著改善短时学习和微调设置中的图像识别任务。


往期精彩回顾适合初学者入门人工智能的路线及资料下载机器学习及深度学习笔记等资料打印机器学习在线手册深度学习笔记专辑《统计学习方法》的代码复现专辑
AI基础下载机器学习的数学基础专辑
本站qq群851320808,加入微信群请扫码:

【深度学习】CV和NLP通吃!谷歌提出OmniNet:Transformers的全方位表示相关推荐

  1. 伯克利『全栈深度学习』2022最新课程;谷歌『基于Transformers的通用超参数优化』经验分享;动图编辑器;前沿论文 | ShowMeAI资讯日报

  2. 【深度学习】煮酒论英雄:深度学习CV领域最瞩目的top成果总结

    前言 如果06年Hinton的深度置信网络是深度学习时代的开启,12年的Alexnet在ImageNet上的独孤求败是深度学习时代的爆发,那么至今也有近15年的发展历程.15年足够让一个青涩懵懂的少年 ...

  3. ckpt下载 deeplabv3_煮酒论英雄:深度学习CV领域最瞩目的成果top46

    原标题:煮酒论英雄:深度学习CV领域最瞩目的成果top46 来源:Smarter 作者:皮特潘 [新智元导读]本文盘点深度学习CV领域杰出的工作,从基础研究.分类骨架.语义分割.实例分割.目标检测.生 ...

  4. 有三AI发布360页11万字深度学习CV算法工程师成长指导手册,可下载收藏打印,未完待续...

    文/编辑 | 言有三 字少事大,各位同学,今天有三AI平台发布<深度学习视觉算法工程师成长指导手册>,超过11万字,360页word文档,可下载收藏打印,且还有大约1/3内容并未完结,最终 ...

  5. 「每周论文推荐」 初入深度学习CV领域必读的几篇文章

    https://www.toutiao.com/a6718570271269192200/ 很多朋友都希望我们开通论文推荐和阅读板块,那就开吧,此专栏名为<每周论文推荐>.在这个专栏里,还 ...

  6. 深度学习:推动NLP领域发展的新引擎

    深度学习:推动NLP领域发展的新引擎 深度学习 NLP Attention Memory 文 / 雷欣,李理 从2015年ACL会议的论文可以看出,目前NLP最流行的方法还是机器学习尤其是深度学习,所 ...

  7. 【每周论文推荐】 初入深度学习CV领域必读的几篇文章

    很多朋友都希望我们开通论文推荐和阅读板块,那就开吧,此专栏名为<每周论文推荐>.在这个专栏里,还是本着有三AI一贯的原则,专注于让大家能够系统性完成学习,所以我们推荐的文章也必定是同一主题 ...

  8. 深度学习CV领域必读论文

    深度学习CV领域必读论文 01 深度学习CV领域划时代论文具有里程碑意义 期刊日期: NIPS-2012,Alexnet 论文名称: <ImageNet Classification with ...

  9. 深度学习CV文章整理

    一.目标检测 1.综述文章 (1).收藏 | YOLO系列综述:从V1到V4 (2).大盘点 | 性能最强的目标检测算法 (3).这7篇CVPR 2020 目标检测论文项目都开源了!Efficient ...

最新文章

  1. 深度学习有哪些trick?
  2. CSS实现垂直居中的5种思路
  3. matlab二阶差分函数,实验5图像分割
  4. HTML+CSS+JavaScript复习笔记持更(一)——标签篇
  5. 算法题007 计算n的阶乘
  6. Linux centosVMware Nginx负载均衡、ssl原理、生成ssl密钥对、Nginx配置ssl
  7. .NET 5 开发WPF - 美食应用登录UI设计
  8. [转]python新手必碰到的问题---encode与decode,中文乱码--转载
  9. java架构师进阶之独孤九剑(一)-算法思想与经典算法
  10. 结构化分析和面向对象分析的区别 例子_管理游戏测评例子
  11. ModuleNotFoundError: No module named 'tornado'解决办法
  12. java 表格升序排列_用JS实现表格的排序
  13. java 绩效考核系统源码_基于jsp的企业绩效考核系统-JavaEE实现企业绩效考核系统 - java项目源码...
  14. python 坦克大战
  15. CAM365|超高性价比CAM软件推荐
  16. Chrome 网页长截图
  17. 随笔(一)—2018-1-23-ANU暑期学校-无题
  18. eclipse官方下载32位和64位的具体步骤
  19. w7设置双显示器_win7如何设置双显示器
  20. 实现一个英文词典的功能

热门文章

  1. Rhythmk 学习 Hibernate 08 - Hibernate annotation 关联关系注解
  2. iOS关于RunLoop和Timer
  3. Core Location定位
  4. 面试题37:两个链表的第一个公共结点
  5. 微信平台开发1--开发者模式基本配置
  6. R语言入门心得(3) -- 向量相关
  7. Enterprise Library: Configuration Application Block类设计分析篇
  8. php 算法 数字比较,数据两两比较的高效算法?
  9. libsvm 训练后,模型参数详解
  10. 中专计算机技术难吗,中专学计算机专业难不难?