ICCV 2021 论文汇总！Vision Transformer

作者丨AI算法与图像处理@知乎

来源丨https://zhuanlan.zhihu.com/p/395764136

编辑丨计算机视觉工坊

作为计算机视觉领域三大会议之一的 ICCV（IEEE International Conference on Computer Vision），已开奖。

计划将ICCV 2021 的论文和代码，以及相关的报告和解读都进行整理（欢迎star）

https://github.com/DWCTOD/ICCV2021-Papers-with-Code-Demo

视频demo和报告汇总在这里：

https://space.bilibili.com/288489574

论文和代码的主要来源：

1）arxiv.org/

2）知乎上大佬的分享

3）github.com/ 上搜索

1、AutoFormer: Searching Transformers for Visual Recognition

论文/paper：https://arxiv.org/abs/2107.00651

代码/code：https://github.com/microsoft/AutoML

2、High-Fidelity Pluralistic Image Completion with Transformers

论文/paper：https://arxiv.org/pdf/2103.14031.pdf

代码/code：https://github.com/raywzy/ICT

3、Generic Attention-model Explainability for Interpreting Bi-Modal and Encoder-Decoder Transformers (Oral)

论文/paper：https://arxiv.org/pdf/2103.15679.pdf

代码/code：https://github.com/hila-chefer/Transformer-MM-Explainability

4、PlaneTR: Structure-Guided Transformers for 3D Plane Recovery

论文/paper：https://arxiv.org/abs/2107.13108

代码/code：https://github.com/IceTTTb/PlaneTR3D

5、Pyramid Vision Transformer: A Versatile Backbone for Dense Prediction without Convolutions

解读：https://zhuanlan.zhihu.com/p/353222035

论文/paper：https://arxiv.org/abs/2102.12122

代码/code：https://github.com/whai362/PVT

6、Rethinking and Improving Relative Position Encoding for Vision Transformer

论文/paper：https://houwenpeng.com/publications/iRPE.pdf

代码/code：https://github.com/wkcn/iRPE-model-zoo

7、Rethinking Spatial Dimensions of Vision Transformers

论文/paper：https://arxiv.org/abs/2103.16302

代码/code：https://github.com/naver-ai/pit

8、Spatial-Temporal Transformer for Dynamic Scene Graph Generation

解读：https://zhuanlan.zhihu.com/p/393637591

论文/paper：https://arxiv.org/abs/2107.12309

代码/code：None

9、Tokens-to-Token ViT: Training Vision Transformers from Scratch on ImageNet

论文/paper：https://arxiv.org/abs/2101.11986

代码/code：https://github.com/yitu-opensource/T2T-ViT

10、Visual Transformer with Statistical Test for COVID-19 Classification

论文/paper：https://arxiv.org/abs/2107.05334

代码/code：None

11、Visual Saliency Transformer

论文/paper：https://arxiv.org/abs/2104.12099

代码/code：https://github.com/nnizhang/VST

本文仅做学术分享，如有侵权，请联系删文。

下载1

在「计算机视觉工坊」公众号后台回复：深度学习，即可下载深度学习算法、3D深度学习、深度学习框架、目标检测、GAN等相关内容近30本pdf书籍。

下载2

在「计算机视觉工坊」公众号后台回复：计算机视觉，即可下载计算机视觉相关17本pdf书籍，包含计算机视觉算法、Python视觉实战、Opencv3.0学习等。

下载3

在「计算机视觉工坊」公众号后台回复：SLAM，即可下载独家SLAM相关视频课程，包含视觉SLAM、激光SLAM精品课程。

重磅！计算机视觉工坊-学习交流群已成立

扫码添加小助手微信，可申请加入3D视觉工坊-学术论文写作与投稿微信交流群，旨在交流顶会、顶刊、SCI、EI等写作与投稿事宜。

同时也可申请加入我们的细分方向交流群，目前主要有ORB-SLAM系列源码学习、3D视觉、CV&深度学习、SLAM、三维重建、点云后处理、自动驾驶、CV入门、三维测量、VR/AR、3D人脸识别、医疗影像、缺陷检测、行人重识别、目标跟踪、视觉产品落地、视觉竞赛、车牌识别、硬件选型、深度估计、学术交流、求职交流等微信群，请扫描下面微信号加群，备注：”研究方向+学校/公司+昵称“，例如：”3D视觉 + 上海交大 + 静静“。请按照格式备注，否则不予通过。添加成功后会根据研究方向邀请进去相关微信群。原创投稿也请联系。

▲长按加微信群或投稿

▲长按关注公众号

3D视觉从入门到精通知识星球：针对3D视觉领域的视频课程（三维重建系列、三维点云系列、结构光系列、手眼标定、相机标定、orb-slam3等视频课程）、知识点汇总、入门进阶学习路线、最新paper分享、疑问解答五个方面进行深耕，更有各类大厂的算法工程人员进行技术指导。与此同时，星球将联合知名企业发布3D视觉相关算法开发岗位以及项目对接信息，打造成集技术与就业为一体的铁杆粉丝聚集区，近2000星球成员为创造更好的AI世界共同进步，知识星球入口：

学习3D视觉核心技术，扫描查看介绍，3天内无条件退款

圈里有高质量教程资料、答疑解惑、助你高效解决问题

觉得有用，麻烦给个赞和在看~

ICCV 2021 论文汇总！Vision Transformer相关推荐

ICCV 2021 | LeViT: a Vision Transformer in ConvNet‘s Clothing for Faster Inference论文阅读笔记
论文:https://arxiv.org/abs/2104.01136 代码(刚刚开源): https://github.com/facebookresearch/LeViT ABSTRACT 我们设 ...
ICCV 2021 Oral | 金字塔视觉Transformer(PVT)：用于密集预测的多功能backbone
点击下方卡片,关注"CVer"公众号 AI/CV重磅干货,第一时间送达本文作者:whai362 | 来源:知乎(已授权) https://zhuanlan.zhihu.com/ ...
iccv2020论文汇总_ICCV2019 最佳论文出炉，附1987~2019历届ICCV最佳论文汇总( 提供下载）...
微信公众号:极市平台极市小编整理了ICCV 2019( IEEE International Conference on Computer Vision)的全部接收论文,大会目前正在韩国首尔如火如荼 ...
【数据竞赛】ICCV 2021 竞赛汇总
ICCV是AI/CV领域的顶会,今年也举办了较多的比赛,本文将对相关的比赛进行汇总,方便大家参赛. ICCV 2021会议地址:http://iccv2021.thecvf.com/home Adva ...
一个算法“拿下”两个榜单！爱奇艺ICCV 2021论文提出人手三维重建新方法
2016年,Facebook正式发售Oculus Rift头戴式VR设备,大大革新了人们对于VR技术的认知,这一年也因此被称为VR元年.5年过去,现在VR技术发展到哪了?从原生VR游戏<半条命: ...
品论文：VISION TRANSFORMER (VIT)
今天上午看了个论文,每当遇到全英文论文的时候,就会发现自己的英文水平属实是太一般,但是看完这篇论文确实是感触良多!!! 论文标题:<AN IMAGE IS WORTH 16X16 WORDS: ...
Transformer自监督学习(2021) - SiT: Self-supervised vIsion Transformer
文章目录原文地址初识相知回顾原文地址 https://arxiv.org/pdf/2104.03602.pdf[萨里大学] 初识采用ViT进行在无标注数据集上进行自监督学习,降低ViT对大 ...
ICCV 2021 Best Paper | Swin Transformer何以屠榜各大CV任务！
作者:陀飞轮@知乎(已授权) 来源:https://zhuanlan.zhihu.com/p/360513527 编辑:智源社区近日,Swin Transformer拿到2021 ICCV Best ...
ICRA 2021论文汇总：视觉-惯性/视觉SLAM
作者丨zzyy@知乎来源丨https://zhuanlan.zhihu.com/p/388715878 编辑丨3D视觉工坊一.视觉惯性组合(21) 1.cooperative Transporta ...
[BMVC 2021] Feature Fusion Vision Transformer for Fine-Grained Visual Categorization
Contents Introduction FFVT Architecture Mutual Attention Weight Selection Module Feature Fusion Modu ...

ICCV 2021 论文汇总！Vision Transformer

ICCV 2021 论文汇总！Vision Transformer相关推荐

最新文章

热门文章