transformer在计算机视觉任务中显示出了巨大的潜力。人们普遍认为,他们基于注意力的token混合器模块对他们的能力贡献最大。然而,最近的工作表明,transformer中基于注意力的模块可以被空间mlp取代,得到的模型仍然表现相当好。基于这一观察,本文假设transformer的通用架构,而不是特定的token mixer模块,对模型的性能更重要。为验证这一点,故意用一个简单得令人尴尬的空间池化操作符取代transformer中的注意力模块,以只进行基本的token混合。提出的模型称为PoolFormer,在多个计算机视觉任务上实现了有竞争力的性能。例如,在ImageNet-1K上,PoolFormer实现了82.1%的top-1精度,比经过良好调整的视觉Transformer/类mlp基线DeiT-B/ResMLP-B24提高了0.3%/1.1%的精度,参数减少了35%/52%,mac减少了50%/62%。PoolFormer的有效性验证了我们的假设,并敦促我们发起" MetaFormer "的概念,一种从transformer抽象出来的通用架构,而不指定token混合器。MetaFormer是在最近的Transformer和类mlp模型在视觉任务上取得优越结果的关键角色。这项工作呼吁未来进行更多致力于改进MetaFormer的研究,而不是专注于token mixer模块。所提出的PoolFormer可以作为未来MetaFormer架构设计的起始基线。

1. 介绍

transformer在计算机视觉领域获得了极大的兴趣和成功[3,8,44,55]。自从视觉Transformer (ViT)[17]将纯Tra

【第59篇】MetaFormer实际上是你所需要的视觉相关推荐

  1. Flutter高仿微信-第59篇-同步数据

     Flutter高仿微信系列共59篇,从Flutter客户端.Kotlin客户端.Web服务器.数据库表结构.Xmpp即时通讯服务器.视频通话服务器.腾讯云服务器全面讲解. 详情请查看 实现代码: / ...

  2. Flutter高仿微信-项目实践59篇

    Flutter高仿微信(支持Android和IOS系统) Flutter高仿微信主要包含5大模块: 1.Web服务器 2.Flutter客户端 3.Xmpp即时通讯服务器 4.视频通话服务器 5.腾讯 ...

  3. 初出茅庐的小李第59篇博客之测试Modbus协议的继电器

    1, Modbus RTU指令详解 发送: FF 05 00 00 FF 00 99 E4 字段 含义 注释 FF 设备地址 范围1-255,默认255 05 功能码 写单个线圈 00 00 继电器地 ...

  4. 白帽子和黑客的区别是什么?如何成为一名白客?这篇文章能给你所有答案

    什么是白帽子? 白帽子指的是一类计算机安全领域的专业人士,他们利用自己的技术和知识来帮助保护计算机系统和网络的安全,以防止黑客攻击和其他恶意行为.白帽子通常是受聘于企业或组织,通过渗透测试和漏洞分析等 ...

  5. k8s跑一个nginx-app体验

    kubectl run 并不是直接创建一个 Pod,而是先创建一个 Deployment 资 源(replicas=1),再由与 Deployment 关联的 ReplicaSet 来自动创建 Pod ...

  6. 【Web技术】561- 网站性能优化之度量篇

    作者:晓风 https://blog.liyaodong.com/posts/website-performance-metrics/ 当你快刀斩乱麻按照网上的性能优化的教程操作了一番之后,你洋洋得意 ...

  7. 《学术研究你的成功之道》读书笔记之论文篇

    <学术研究你的成功之道>读书笔记之论文篇 五年前的一次机器学习会议上,正逢凌晓峰教授签名出售新书<学术研究你的成功之道>,心血来潮买了一本,翻了一下觉得写得很不错.近日由于要在 ...

  8. CVPR2022 oral | MetaFormer才是探索Transformer的源泉,衍生PoolFormer速度喜人

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 Transformer在计算机视觉任务中显示出了巨大的潜力.一个普 ...

  9. 写代码时发现......还得是 SpringBoot !一篇拿下

    关注了很多技术类公众号的读者肯定有这样一个感受,SpringBoot相关的文章铺天盖地,并且SpringBoot相关的文章阅读量.收藏量都很高,这也从侧面反映了SpringBoot技术的火爆. 一切都 ...

最新文章

  1. SP3946 MKTHNUM - K-th Number(整体二分)
  2. 解决ifconfig命令未找到
  3. 线段树 求矩形并 面积
  4. 300. 最长上升子序列
  5. 大众流行编程语言有哪些 该选择哪一个来入门
  6. javadocx转换成html_使用Java将Word转为Html或txt[转]
  7. Python程序设计语言基础06(完):组合数据类型
  8. eclipse 大括号 改为C语言风格
  9. 软件测试价值提升之路--第2部分“扫门前雪”-第3章“拦截缺陷”-读书笔记
  10. Rstudio插入Excel数据
  11. 播放全景视频【一】:用unity Video Player视频播放器来播放360全景视频
  12. Promise then的嵌套
  13. 浅谈前端的数据驱动和事件驱动
  14. 【计算机硬件组成】基础知识(必备)
  15. 记录四川移动盒子打开adb命令的方法 型号:UNT402H
  16. 2007年12月全球十大搜索引擎
  17. DOS下如何查看电脑硬盘分区
  18. 决策树实例-泰坦尼克幸存者预测
  19. 判断excel表格中某个单元格是否是合并单元格
  20. 热血传奇技术的一些基础知识

热门文章

  1. 【亲测已解决】CentOS7 ifconfig commend not fount(命令找不到)
  2. 算法小课堂(十)随机化算法
  3. 12 模式的模式:复合模式
  4. EXCEL 2010添加趋势线
  5. 专访黄文斌丨中专文凭的他,辞掉了9年的国企“铁饭碗”
  6. 「 JVM基础 」Java双亲委派机制
  7. 蓝桥杯历年试题汇总 C/C++ B组
  8. python黑客库长安十二时辰 更新_程序员爬取 3 万条评论,《长安十二时辰》槽点大揭秘!...
  9. 主流微服务注册中心浅析和对比 1
  10. DB 查询分析器 6.03 在Windows 8 上安装与运行演示