作者丨happy
​编辑丨极市平台

论文链接:https://arxiv.org/pdf/2110.11945.pdf

代码链接:https://github.com/fudan-zvg/SOFT

项目链接:https://fudan-zvg.github.io/SOFT/

本文是复旦大学&华为诺亚关于Transformer中自注意力机制复杂度的深度思考,首次提出了一种新颖的softmax-free 的Transformer 。本文从softmax self-attention局限性出发,分析了其存在的挑战;然后由此提出了线性复杂度的SOFT;再针对线性SOFT存在的训练问题,提出了一种具有理论保证的近似方案。所提SOFT在ImageNet分类任务上取得了比已有CNN、Transformer更佳的精度-复杂度均衡。

阅读完整原文:去掉softmax后Transformer会更好吗?复旦&华为诺亚提出SOFT:轻松搞定线性近似

去掉softmax后Transformer会更好吗?复旦华为诺亚提出SOFT相关推荐

  1. 【深度学习】去掉softmax后Transformer会更好吗?复旦华为诺亚提出SOFT:轻松搞定线性近似...

    作者丨happy  编辑丨极市平台 导读 本文介绍了复旦大学&华为诺亚提出的一种新颖的softmax-free的Transformer-SOFT.所提SOFT显著改善了现有ViT方案的计算效率 ...

  2. NeurIPS 2021 Transformer部署难?北大华为诺亚提出Vision Transformer的后训练量化方法...

    关注公众号,发现CV技术之美 本文分享 NeurIPS 2021 论文『Post-Training Quantization for Vision Transformer』,由北大&华为诺亚联 ...

  3. 当CNN遇见Transformer!华为诺亚提出CMT:新视觉Backbone

    点击下方卡片,关注"CVer"公众号 AI/CV重磅干货,第一时间送达 转载自:AIWalker 标题&作者团队 CMT: Convolutional Neural Net ...

  4. 【读点论文】A Survey on Vision Transformer,2022年华为诺亚最新综述研究,从发展到任务,整体到局部。ViT有研究价值在于有很多问题还没有解决,真理是阶段性的产物

    A Survey on Vision Transformer Abstract transformer最早应用于自然语言处理领域,是一种主要基于自注意机制的深度神经网络.由于其强大的表示能力,研究人员 ...

  5. 收藏 | 图像处理Transformer:华为诺亚、北大等IPT模型,刷榜

    点上方蓝字计算机视觉联盟获取更多干货 在右上方 ··· 设为星标 ★,与你不见不散 仅作学术分享,不代表本公众号立场,侵权联系删除 转载于:机器之心 AI博士笔记系列推荐 周志华<机器学习> ...

  6. 太强啦!华为诺亚ViG架构媲美CNN、Transformer(重磅开源)

    来源:机器之心 华为诺亚实验室的研究员发现图神经网络(GNN)也能做视觉骨干网络.将图像表示为图结构,通过简洁高效的适配,提出一种新型视觉网络架构 ViG,表现优于传统的卷积网络和 Transform ...

  7. 华为诺亚ViG架构媲美CNN、Transformer,图神经网络也能用作CV骨干模型

    华为诺亚实验室的研究员发现图神经网络(GNN)也能做视觉骨干网络.将图像表示为图结构,通过简洁高效的适配,提出一种新型视觉网络架构 ViG,表现优于传统的卷积网络和 Transformer.在 Ima ...

  8. 图神经网络也能用作CV骨干模型,华为诺亚ViG架构媲美CNN、Transformer

    来源丨机器之心 华为诺亚实验室的研究员发现图神经网络(GNN)也能做视觉骨干网络.将图像表示为图结构,通过简洁高效的适配,提出一种新型视觉网络架构 ViG,表现优于传统的卷积网络和 Transform ...

  9. 华为诺亚最新视觉Transformer综述

    点击上方"视学算法",选择加"星标"或"置顶" 重磅干货,第一时间送达 来源丨机器之心 编辑丨极市平台 导读 华为诺亚方舟实验室联合北大和悉 ...

最新文章

  1. c语言编写木马软件,【C语言】后台木马程序
  2. 通俗易懂详解Java代理及代码实战
  3. 开发者必备的12个JavaScript库
  4. Securing the Deep Learning Stack
  5. 第二天:装饰模式及面向对象设计原则4则
  6. 开源商务智能软件Pentaho
  7. 阿里巴巴Java开发手册——速读记录
  8. Django 数据库建表的时候 No migrations to apply原因出现和解决
  9. 从select函数谈及系统调用原理
  10. 区块链浏览器_YOYOW正式发布更新版本区块链浏览器
  11. opensuse安装pycharm
  12. bios刷写工具_蓝天P750/P751编程器刷BIOS
  13. Eplan2.7 安装教程
  14. 在线浏览stp(step)文件(一)
  15. iTunes现在已在Microsoft Store中
  16. SSL1659 栈练习括弧匹配检验
  17. Vue常用经典开源项目汇总参考-海量
  18. R语言ggplot2可视化:使用ggpubr包的arrangeGrob函数将多个可视化结果整合为gtable对象、使用as_ggplot函数将gtable对象转化为ggplot对象
  19. gdkoi 2023
  20. 百度云模拟登陆批量保存Python版(一)

热门文章

  1. 奇怪的.strip(alir) #()里面有东西 待问老师........
  2. 八:MVC初始化数据库
  3. requirejs配置问题
  4. 【深度学习】词的向量化表示
  5. Map与object的区别
  6. Linux环境下安装PHP的memced扩展
  7. C#多线程学习之(五)使用定时器进行多线程的自动管理
  8. Mono.Android 基础
  9. Nginx + PHP CGI的fix_pathinfo安全漏洞
  10. python怎么安装tensorflow-Python使用pip安装TensorFlow模块