语义分割在ADE20K上刷到53.5 mIoU,超过之前SOTA大概4.5 mIoU!

Swin Transformer: Hierarchical Vision Transformer using Shifted Windows

(Swin Transformer:使用移位窗口的分层视觉变换器)

Transformer从NLP迁移到CV上没有大放异彩主要有两点原因:

1. 两个领域涉及的scale不同,NLP的scale是标准固定的,而CV的scale变化范围非常大。

2. CV比起NLP需要更大的分辨率,而且CV中使用Transformer的计算复杂度是图像尺度的平方,这会导致计算量过于庞大。为了解决这两个问题,Swin Transformer相比之前的ViT做了两个改进:

1.引入CNN中常用的层次化构建方式构建层次化Transformer

2.引入locality思想,对无重合的window区域内进行自注意力计算。

注:

mIOU(均交并比):计算真实值和预测值两个集合的交集和并集之比。这个比例可以变形为TP(交集)比上TP、FP、FN之和(并集)。即:mIOU=TP/(FP+FN+TP)。

语义分割Swin Transformer相关推荐

  1. 【深度学习】Transformer在语义分割上的应用探索

    [深度学习]Transformer在语义分割上的应用探索 文章目录 1 Segmenter 2 Swin-Unet:Unet形状的纯Transformer的医学图像分割 3 复旦大学提出SETR:基于 ...

  2. 【论文阅读】Swin Transformer Embedding UNet用于遥感图像语义分割

    [论文阅读]Swin Transformer Embedding UNet用于遥感图像语义分割 文章目录 [论文阅读]Swin Transformer Embedding UNet用于遥感图像语义分割 ...

  3. Transformer 杀疯了,图像去雨、人脸幻构、风格迁移、语义分割等通通上分

    前段时间 Transformer 已席卷计算机视觉领域,并获得大量好评,如『基于Swin-Transformer』.『美团提出具有「位置编码」的Transformer,性能优于ViT和DeiT』.『L ...

  4. Swin-Unet跑自己的数据集(Transformer用于语义分割)

    原始代码位置: GitHub - HuCaoFighting/Swin-Unet: The codes for the work "Swin-Unet: Unet-like Pure Tra ...

  5. Swin Transformer实战实例分割:训练自己的数据集

    课程链接:Swin Transformer实战实例分割:训练自己的数据集--计算机视觉视频教程-人工智能-CSDN程序员研修院 Transformer发轫于NLP(自然语言处理),并跨界应用到CV(计 ...

  6. 【深度学习】SETR:基于视觉 Transformer 的语义分割模型

    Visual Transformer Author:louwill Machine Learning Lab 自从Transformer在视觉领域大火之后,一系列下游视觉任务应用研究也随之多了起来.基 ...

  7. 性能超最先进卷积!用Transformer进行图像语义分割!

    点上方计算机视觉联盟获取更多干货 仅作学术分享,不代表本公众号立场,侵权联系删除 转载于:量子位 AI博士笔记系列推荐 周志华<机器学习>手推笔记正式开源!可打印版本附pdf下载链接 正如 ...

  8. 【深度学习】语义分割:论文阅读:(CVPR 2022) MPViT(CNN+Transformer):用于密集预测的多路径视觉Transformer

    这里写目录标题 0详情 1摘要 2 主要工作 3 网络结构 3.1 Conv-stem 3.2 Multi-Scale Patch Embedding 3.3 Multi-path Transform ...

  9. ICCV 2021 | Transformer再助力!用CWT进行小样本语义分割

    点击下方卡片,关注"CVer"公众号 AI/CV重磅干货,第一时间送达 作者 | 卢治合  编辑 | 王晔 本文转载自:AI科技评论 本文是对发表于计算机视觉领域的顶级会议 ICC ...

  10. 从CNN到Transformer:基于PyTorch的遥感影像、无人机影像的地物分类、目标检测、语义分割和点云分类

    更多资讯,请关注:Ai尚研修科研技术动态 公众号 我国高分辨率对地观测系统重大专项已全面启动,高空间.高光谱.高时间分辨率和宽地面覆盖于一体的全球天空地一体化立体对地观测网逐步形成,将成为保障国家安全 ...

最新文章

  1. 在Ubuntu 14.04 64bit上使用dig
  2. 数据库历险记(二) | Redis 和 Mecached 到底哪个好?
  3. lintcode二叉树的锯齿形层次遍历 (双端队列)
  4. 使用Visual Studio Code开发Asp.Net Core WebApi学习笔记(二)-- Web Api Demo
  5. 结构体中vector自动为0_面试题:你是如何选择顺序存储数据结构的?
  6. API:互联网是如何在幕后工作的?
  7. 深入解读Linux进程调度系列——数据结构解析
  8. 计算机无法安装VC2015,解决win10安装vc ++2015提示“一个或多个问题导致了安装失败”的方法...
  9. mysql 计算天数_mysql计算两个日期之间的天数
  10. Qt使用QChart制作多路虚拟示波器
  11. 【学习笔记】标签噪声下用于鲁棒性学习的对称交叉熵损失函数
  12. sublime text 3143 授权码
  13. 罗永浩 AR 创业公司估值 10 亿;​苹果宣布加大 AppStore 广告推送量;​Node.js 19 发布|极客头条...
  14. Linux系统之管道符
  15. 迁移学习——Transitive Transfer Learning
  16. 【断章取义】闹阴司司马貌断狱
  17. 镜头像差之一——球差
  18. C语言-基本计算-四则运算
  19. Python基础知识学习(六)——包与模块:指令、包加载步骤、搜索范围
  20. codevs【1569】最佳绿草

热门文章

  1. day21 re模块
  2. How to Create and Drop database in MongoDB
  3. 《Python机器学习——预测分析核心算法》——2.3 对“岩石vs.水雷”数据集属性的可视化展示...
  4. linux信任公钥的配置
  5. [233]树莓派裸机代码bootloader学习总结
  6. 深入理解jQuery中的事件冒泡
  7. 磁盘上没有足够的空间完成此操作_Win10硬盘怎么分区?Win10系统下新建磁盘分区图解教程...
  8. C++:数组的输入、排序与去重操作
  9. iis服务器转发消息至服务端,IIS服务器配置NXLog进行syslog转发
  10. koa2 session mysql_koa2+vue+axios搭建一个博客台管理系统之session踩坑