作者丨AI算法与图像处理@知乎

来源丨https://zhuanlan.zhihu.com/p/395764136

编辑丨计算机视觉工坊

作为计算机视觉领域三大会议之一的 ICCV(IEEE International Conference on Computer Vision),已开奖。

计划将ICCV 2021 的论文和代码,以及相关的报告和解读都进行整理(欢迎star)

https://github.com/DWCTOD/ICCV2021-Papers-with-Code-Demo

视频demo和报告汇总在这里:

https://space.bilibili.com/288489574

论文和代码的主要来源:

1)arxiv.org/

2)知乎上大佬的分享

3)github.com/ 上搜索

1、AutoFormer: Searching Transformers for Visual Recognition

论文/paper:https://arxiv.org/abs/2107.00651

代码/code:https://github.com/microsoft/AutoML

2、High-Fidelity Pluralistic Image Completion with Transformers

论文/paper:https://arxiv.org/pdf/2103.14031.pdf

代码/code:https://github.com/raywzy/ICT

3、Generic Attention-model Explainability for Interpreting Bi-Modal and Encoder-Decoder Transformers (Oral)

论文/paper:https://arxiv.org/pdf/2103.15679.pdf

代码/code:https://github.com/hila-chefer/Transformer-MM-Explainability

4、PlaneTR: Structure-Guided Transformers for 3D Plane Recovery

论文/paper:https://arxiv.org/abs/2107.13108

代码/code:https://github.com/IceTTTb/PlaneTR3D

5、Pyramid Vision Transformer: A Versatile Backbone for Dense Prediction without Convolutions

解读:https://zhuanlan.zhihu.com/p/353222035

论文/paper:https://arxiv.org/abs/2102.12122

代码/code:https://github.com/whai362/PVT

6、Rethinking and Improving Relative Position Encoding for Vision Transformer

论文/paper:https://houwenpeng.com/publications/iRPE.pdf

代码/code:https://github.com/wkcn/iRPE-model-zoo

7、Rethinking Spatial Dimensions of Vision Transformers

论文/paper:https://arxiv.org/abs/2103.16302

代码/code:https://github.com/naver-ai/pit

8、Spatial-Temporal Transformer for Dynamic Scene Graph Generation

解读:https://zhuanlan.zhihu.com/p/393637591

论文/paper:https://arxiv.org/abs/2107.12309

代码/code:None

9、Tokens-to-Token ViT: Training Vision Transformers from Scratch on ImageNet

论文/paper:https://arxiv.org/abs/2101.11986

代码/code:https://github.com/yitu-opensource/T2T-ViT

10、Visual Transformer with Statistical Test for COVID-19 Classification

论文/paper:https://arxiv.org/abs/2107.05334

代码/code:None

11、Visual Saliency Transformer

论文/paper:https://arxiv.org/abs/2104.12099

代码/code:https://github.com/nnizhang/VST

本文仅做学术分享,如有侵权,请联系删文。

下载1

在「计算机视觉工坊」公众号后台回复:深度学习,即可下载深度学习算法、3D深度学习、深度学习框架、目标检测、GAN等相关内容近30本pdf书籍。

下载2

在「计算机视觉工坊」公众号后台回复:计算机视觉,即可下载计算机视觉相关17本pdf书籍,包含计算机视觉算法、Python视觉实战、Opencv3.0学习等。

下载3

在「计算机视觉工坊」公众号后台回复:SLAM,即可下载独家SLAM相关视频课程,包含视觉SLAM、激光SLAM精品课程。

重磅!计算机视觉工坊-学习交流群已成立

扫码添加小助手微信,可申请加入3D视觉工坊-学术论文写作与投稿 微信交流群,旨在交流顶会、顶刊、SCI、EI等写作与投稿事宜。

同时也可申请加入我们的细分方向交流群,目前主要有ORB-SLAM系列源码学习、3D视觉CV&深度学习SLAM三维重建点云后处理自动驾驶、CV入门、三维测量、VR/AR、3D人脸识别、医疗影像、缺陷检测、行人重识别、目标跟踪、视觉产品落地、视觉竞赛、车牌识别、硬件选型、深度估计、学术交流、求职交流等微信群,请扫描下面微信号加群,备注:”研究方向+学校/公司+昵称“,例如:”3D视觉 + 上海交大 + 静静“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进去相关微信群。原创投稿也请联系。

▲长按加微信群或投稿

▲长按关注公众号

3D视觉从入门到精通知识星球:针对3D视觉领域的视频课程(三维重建系列、三维点云系列、结构光系列、手眼标定、相机标定、orb-slam3等视频课程)、知识点汇总、入门进阶学习路线、最新paper分享、疑问解答五个方面进行深耕,更有各类大厂的算法工程人员进行技术指导。与此同时,星球将联合知名企业发布3D视觉相关算法开发岗位以及项目对接信息,打造成集技术与就业为一体的铁杆粉丝聚集区,近2000星球成员为创造更好的AI世界共同进步,知识星球入口:

学习3D视觉核心技术,扫描查看介绍,3天内无条件退款

圈里有高质量教程资料、答疑解惑、助你高效解决问题

觉得有用,麻烦给个赞和在看~  

ICCV 2021 论文汇总!Vision Transformer相关推荐

  1. ICCV 2021 | LeViT: a Vision Transformer in ConvNet‘s Clothing for Faster Inference论文阅读笔记

    论文:https://arxiv.org/abs/2104.01136 代码(刚刚开源): https://github.com/facebookresearch/LeViT ABSTRACT 我们设 ...

  2. ICCV 2021 Oral | 金字塔视觉Transformer(PVT):用于密集预测的多功能backbone

    点击下方卡片,关注"CVer"公众号 AI/CV重磅干货,第一时间送达 本文作者:whai362 |  来源:知乎(已授权) https://zhuanlan.zhihu.com/ ...

  3. iccv2020论文汇总_ICCV2019 最佳论文出炉,附1987~2019历届ICCV最佳论文汇总( 提供下载)...

    微信公众号:极市平台 极市小编整理了ICCV 2019( IEEE International Conference on Computer Vision)的全部接收论文,大会目前正在韩国首尔如火如荼 ...

  4. 【数据竞赛】ICCV 2021 竞赛汇总

    ICCV是AI/CV领域的顶会,今年也举办了较多的比赛,本文将对相关的比赛进行汇总,方便大家参赛. ICCV 2021会议地址:http://iccv2021.thecvf.com/home Adva ...

  5. 一个算法“拿下”两个榜单!爱奇艺ICCV 2021论文提出人手三维重建新方法

    2016年,Facebook正式发售Oculus Rift头戴式VR设备,大大革新了人们对于VR技术的认知,这一年也因此被称为VR元年.5年过去,现在VR技术发展到哪了?从原生VR游戏<半条命: ...

  6. 品论文:VISION TRANSFORMER (VIT)

    今天上午看了个论文,每当遇到全英文论文的时候,就会发现自己的英文水平属实是太一般,但是看完这篇论文确实是感触良多!!! 论文标题:<AN IMAGE IS WORTH 16X16 WORDS: ...

  7. Transformer自监督学习(2021) - SiT: Self-supervised vIsion Transformer

    文章目录 原文地址 初识 相知 回顾 原文地址 https://arxiv.org/pdf/2104.03602.pdf[萨里大学] 初识 采用ViT进行在无标注数据集上进行自监督学习,降低ViT对大 ...

  8. ICCV 2021 Best Paper | Swin Transformer何以屠榜各大CV任务!

    作者:陀飞轮@知乎(已授权) 来源:https://zhuanlan.zhihu.com/p/360513527 编辑:智源社区 近日,Swin Transformer拿到2021 ICCV Best ...

  9. ICRA 2021论文汇总:视觉-惯性/视觉SLAM

    作者丨zzyy@知乎 来源丨https://zhuanlan.zhihu.com/p/388715878 编辑丨3D视觉工坊 一.视觉惯性组合(21) 1.cooperative Transporta ...

  10. [BMVC 2021] Feature Fusion Vision Transformer for Fine-Grained Visual Categorization

    Contents Introduction FFVT Architecture Mutual Attention Weight Selection Module Feature Fusion Modu ...

最新文章

  1. flask的客户端服务端
  2. Java中String类的方法及说明
  3. IE6/7和IE8/9(怪异模式)浮动元素折行Bug
  4. Bottle 框架中的装饰器类和描述符应用
  5. BZOJ 3434 时空穿梭
  6. zeppelin连接数据源_使用开放源代码合同(open-zeppelin)创建以太坊令牌
  7. tomcat中设置Java 客户端程序的http(https)访问代理
  8. php多少内置函数,php有多少个内置函数
  9. angularjs内置63个指令
  10. java做校园一卡通技术_java写的简单校园卡管理系统
  11. postman批量测试成功newman生成测试报告失败
  12. Vbs脚本编程简明教程之二
  13. Python基础之爬取豆瓣图书信息
  14. 关于PC上的护眼大师这个软件
  15. 【ADNI】数据预处理(2)获取 subject slices
  16. 重庆阿尔克分析2020中国经济,为什么实体经济干不过虚拟经济?
  17. 表达无序列表语义的html标签是,HTML语义标签的介绍和常用的语义标签
  18. Linked_data
  19. vsftpd通过cmds_allowed进行精确权限控制
  20. python惰性求值例子_惰性求值和yield-Python

热门文章

  1. java-spark的各种常用算子的写法
  2. JS重要知识点总结-不完善
  3. 移动互联网时代,如何优化你的网络 —— 域名解析篇
  4. phpFreeChat 2.0.0 发布,Web 聊天室
  5. 8个习惯让你减肥不用节食 - 生活至上,美容至尚!
  6. 微软将VB和C#合二为一 年底推出全新平台VS2010
  7. 5555555,老粘不上来。。
  8. 【java】 jsp网页session和application,全局变量方法
  9. vscode-设置tab转空格数4为2
  10. 百度地图坐标系统应用