目录

  • 简介
  • 动机
  • 方法
  • 实验

简介

本文出自华为诺亚方舟,作者是韩凯。
文章链接

动机

本文动机是,在ViT基础上,编码patch内的pixel之间的结构信息。

方法

使用两个transformer,外transformer负责编码大小为16×1616 \times 1616×16的patch之间的关系,内transformer负责编码大小为4×44 \times 44×4的super-pixel之间的关系。


实验

本文方法的实验结果也很好。




arXiv 2021《Transformer in Transformer》论文笔记相关推荐

  1. ACL2021论文笔记——Constructing Multi-Modal Dialog Dataset by Replacing Text with Semantically Relev Image

    论文链接: Constructing Multi-Modal Dialogue Dataset by Replacing Text with Semantically Relevant Images ...

  2. 【time series】时间序列领域的Transformer综述论文笔记

    论文名称:Transformers in Time Series: A Survey 论文年份:2022/5/7 论文作者:阿里巴巴达摩院 论文下载:https://arxiv.org/abs/220 ...

  3. 【时序】应用于时间序列的 Transformer 综述论文笔记

    论文名称:Transformers in Time Series: A Survey 论文下载:https://arxiv.org/abs/2202.07125 论文源码:https://github ...

  4. 【论文笔记】Vision Transformer for Small-Size Datasets

    目录 创新点 架构 Shifted Patch Tokenization(SPT) Locality Self-Attention(LSA) 总结 实验 写在最后 论文标题:Vision Transf ...

  5. 【论文笔记】Segmenting Transparent Object in the Wild with Transformer

    声明 不定期更新自己精读的论文,通俗易懂,初级小白也可以理解 涉及范围:深度学习方向,包括 CV.NLP.Data fusion.Digital Twin 论文标题: Segmenting Trans ...

  6. [论文笔记]SwinSUNet: Pure Transformer Network for Remote Sensing Image Change Detection

    1 论文标题 标题: SwinSUNet: Pure Transformer Network for Remote Sensing Image Change Detection 作者: Cui Zha ...

  7. 论文笔记-Vanilla Transformer:Character-Level Language Modeling with Deeper Self-Attention

    论文笔记-Vanilla Transformer:Character-Level Language Modeling with Deeper Self-Attention 1. 介绍 2. Chara ...

  8. 【时序】卷积自注意力 LogSparse Transformer 论文笔记

    论文名称:Enhancing the Locality and Breaking the Memory Bottleneck of Transformer on Time Series Forecas ...

  9. 【时序】Informer:用于长序列预测的高效 Transformer 论文笔记

    论文名称:Informer: Beyond Efficient Transformer for Long Sequence Time-Series Forecasting 论文下载:https://a ...

  10. 论文笔记 | 【CVPR-2023】Activating More Pixels in Image Super-Resolution Transformer

    论文笔记 | [CVPR-2023]Activating More Pixels in Image Super-Resolution Transformer 抛砖引玉了,如有不同意见欢迎讨论. 目录 ...

最新文章

  1. html文本框对齐 display:block,html – 在所有浏览器中垂直对齐标签和文本框
  2. mysql的in和not in的用法(特别注意not in结果集中不能有null)
  3. matlab命令fvtool,FVTool: a finite volume toolbox for Matlab
  4. 给将要进入职场的同学 - 开发软件不是闭卷考试
  5. (计算机组成原理)第五章中央处理器-第三节2:CPU专用数据通路
  6. Hanlp自然语言处理工具的使用演练
  7. Java千百问_05面向对象(013)_泛型如何使用
  8. whale 帷幄数字化营销运营平台
  9. 进制转换表与课程内容
  10. 电箱吉他与原声吉他的区别在哪里?初学者应该选哪个呢?
  11. html制作页面书签的步骤,网页制作基础教程(二)html标签
  12. DNS相关知识及其配置
  13. vs.Net2003无法打开或创建Web应用程序若干解决办法
  14. Python制作连连看脚本工具,全程自动,不需要你动,简直太爽了
  15. Java(回文数--一种比较简单的写法)
  16. 市场营销学【最精典】案例分析
  17. 物联网通信技术期末复习5:第五章-网络传输技术
  18. 微服务设计中关于服务组合和可视化编排的思考
  19. 开源Linux容器 OpenVZ 快速上手指南
  20. 物流配货网(jsp+struts2+mysql)总结

热门文章

  1. 同学录APP开题报告 2017-12-14
  2. [C++学习笔记]C++常见问题大全(二)
  3. 【干货】吴恩达deeplearning.ai专项课程历史文章汇总
  4. java中获取文件总行数_关于java:如何以有效的方式获取文件中的行数?
  5. Redis批量操作详解及性能分析
  6. VTK修炼之道15:图像处理_显示(vtkImageViewer2 vtkImageActor)
  7. 服务程序增加系统托盘
  8. SQL注入之堆叠注入(sql-lab第38关)
  9. geth安装失败,双击后不显示或等待很久后报错
  10. 批处理以当前时间为文件名创建文件