论文地址

本文主要研究学习一种新的Transformer架构——Swin Transformer,其目的:新建一个通用架构

Transfoemer从NLP应用到CV领域存在以下几个挑战

痛点:CV中视觉块的变化尺度大;图像像素的高分辨率;——动机

  • scale:视觉元素在规模上可能有很大的差异;
  • High Resolution:像素级,更高分辨率,自注意力的计算复杂度是二次的。

本文:提出一个Hierarchical(分层)Transformer ,通过shifted windows(Swin)进行特征表示,将自注意力限制在无重叠的局部窗口,结合交叉窗口连接——模型灵活,在图像分类、稠密预测(目标检测、语义分割),都取得了一定提升。获得了更低的时延。

Hierarchical(分层)Transformer——捕获分层特征图+线性复杂度

  • 分层特征图:小尺寸的patch,融合neighbor patch
  • 线性复杂度:计算局部自注意力机制,fixed patch,local
  • 核心:连续的自注意层之间移动窗口分区

架构学习

  • swin transformer block:用基于Shifted-window替代原标准多头自注意力模块,线性复杂度替代二次计算。
  • 基于自注意力的移动窗口:局部窗口自注意力计算;窗口间的连接(移动窗口分区方案);
  • 第一个模块使用从左上角像素开始的规则窗口划分策略(New),将8×8特征映射均匀划分为2个大小为4×4的窗口。然后,下一个模块采用一种窗口配置,从前一层的窗口配置中移动,通过从规则划分的窗口中替换(M/2,M/2)像素的窗口。
  • 针对移位配置的高效批计算:以前的pad的填充再屏蔽的方法,在窗口过小的情况下,会提高计算量;本文整改:循环移位-向左上方移动。——降低计算量。

Deconvolution - 简书 (jianshu.com)

Swin Transformer : Hierarchical Vision Transformer using Shifted Windows相关推荐

  1. 【读点论文】Swin Transformer: Hierarchical Vision Transformer using Shifted Windows通过窗口化进行局部MSA,sw-MSA融合信息

    Swin Transformer: Hierarchical Vision Transformer using Shifted Windows abstract 本文提出了一种新的视觉transfor ...

  2. Swin Transformer: Hierarchical Vision Transformer using Shifted Windows

    目录 Introduction Method Hierarchical feature maps and Linear computational complexity Patch merging S ...

  3. 【文献阅读】Swin Transformer: Hierarchical Vision Transformer using Shifted Windows

    题目:Swin Transformer: Hierarchical Vision Transformer using Shifted Windows 时间:2021 会议/期刊:ICCV 2021 研 ...

  4. 【Transformer 论文精读】……Swin Transformer……(Hierarchical Vision Transformer using Shifted Windows)

    文章目录 一.Abstract(摘要) 二.Introduction(引言) 三.Related Work(相关工作) 四.Method(方法) 1.Patch Merging模块 2.W-MSA模块 ...

  5. 【Swin Transformer】Swin Transformer: Hierarchical Vision Transformer using Shifted Windows

    文章:https://arxiv.org/abs/2103.14030 代码:GitHub - microsoft/Swin-Transformer: This is an official impl ...

  6. 论文阅读笔记:Swin Transformer: Hierarchical Vision Transformer using Shifted Windows

    论文阅读笔记:Swin Transformer 摘要 1 简介 2 相关工作 3 方法论 3.1 总览 Swin Transformer block 3.2 shifted window-based ...

  7. Swin Transformer: Hierarchical Vision Transformer using Shifted Windows论文阅读

    Swin Transformer: Hierarchical Vision Transformer using Shifted Windows论文阅读 摘要 介绍 相关工作 方法 整个架构 基于sel ...

  8. 13、Swin Transformer: Hierarchical Vision Transformer using Shifted Windows

    简介 主页:https://github. com/microsoft/Swin-Transformer. Swin Transformer 是 2021 ICCV最佳论文,屠榜了各大CV任务,性能优 ...

  9. Swin Transformer: Hierarchical Vision Transformer using Shifted Windows 论文翻译 + 网络详解

    目录 1 3 4 5 是论文的翻译,如果看过论文也可以直接看关于网络的结构详解. Abstract 1. Introduction 3. Method 3.1 Overall Architicture ...

  10. Swin Transformer: Hierarchical Vision Transformer using Shifted Windows 阅读理解

    原文地址:https://arxiv.org/pdf/2103.14030.pdf 收录:CVPR 2021 Best paper 代码: https://github.com/microsoft/S ...

最新文章

  1. android列表勾选框,android listview实现复选框列表
  2. Kubernetes基础学习(一)
  3. java 文件上传ssm_ssm框架下实现文件上传
  4. php两个数组找公共部分,PHP开发中如何查找两个数组的交集
  5. 短信微信等消息发送系统的架构设计
  6. Golang的数组与切片——详解
  7. Ubuntu 11.04 beta 2发布!
  8. php 多层 对象,php多层数组和对象的转换
  9. bzoj 1406: [AHOI2007]密码箱
  10. 语音识别基本原理介绍------dnn-hmm续
  11. 华为P40与周冬雨排列
  12. 测试不同体重体型软件样子的,一种智能体型体重测量仪的设计
  13. 建Kangle+EasyPanel对接SWAP IDC虚拟主机自助开通完整教程
  14. 2021高考成绩查询怎么查小分,2021微信哪个小程序可以查成绩 高考成绩怎么查
  15. 台灯的品质,决定了你的阅读质量
  16. 明明没PS,看起来却像PS过的照片!
  17. 腾讯云实时音视频带你玩转语音聊天室
  18. [人工智能]北美18名校的数据挖掘,数据分析,人工智能及机器学习课程汇总
  19. React,手写简易redux(二)- By Viga
  20. 目前最新NIST随机数测试软件下载、安装、及使用教程

热门文章

  1. 考研 计算机网络第二章物理层 知识点总结
  2. AutoCAD入门——斜线
  3. google app 微信 facebook 签名不对(2021最新,关于Google Play app signing问题)
  4. mysql保存不了微信表情符emoji问题解决方案
  5. c语言整型数据类型及存储形式详解
  6. 质证辩论中如何反驳方法
  7. 辩驳一个默认的说法:IE6不支持!important (转http://www.cnblogs.com/lanyueer/archive/2011/03/29/1998398.html)
  8. 旧文备份: CANopen的LSS子协议中文翻译
  9. php顶一下踩一下,wordpress仿dedecms的顶一下踩一下插件下载(代发)
  10. android ListView详解,你不知道的事 (后附焦点解决方法)