Backbone - Involution: Inverting the Inherence of Convolution for Visual Recognition
文章目录
- 0. 前言
- 1. 要解决什么问题
- 2. 用了什么方法
- 3. 效果如何
- 4. 还存在什么问题&可借鉴之处
0. 前言
- 相关资料:
- arxiv
- github
- 论文解读
- 论文基本信息
- 领域:卷积基本结构
- 作者单位:港科技&字节
- 发表时间:CVPR 2021 Oral
- 一句话总结:设计了一种“内卷”的卷积结构替代普通卷积,卷积核是通过特征图算出来的
1. 要解决什么问题
- 卷积操作有两个固有特点
- spatial-agnostic:同一个卷积核到图像的哪个位置都能用,换句话说,所有位置都使用同一个卷积核
- 存在的问题:限制了卷积核提取特征的的能力(其实每个位置应该通过不同的方式提取特征,且特征提取范围也不应该局限于感受域)
- channel-specific:每个channel都提取不同类型的特征(这个比较玄学)
- 存在的问题:数据冗余
- spatial-agnostic:同一个卷积核到图像的哪个位置都能用,换句话说,所有位置都使用同一个卷积核
- 上面的 agnostic 和 specific 可以理解为互为反义词
- 在本文语境中,我个人觉得,agnostic 可理解为“通用”,specific 可理解为“特定”
2. 用了什么方法
- 提出的Involution结构与普通卷积完全相反
- spatial-specific:即空间上每个位置卷积操作对应的卷积核是不同的
- channel-agnostic:每个channel对应的卷积核是相同的
- 相关伪代码如下
- 重点在于
nn.Unfold
,其实就是滑框操作,获取每个位置的卷积输入
- 重点在于
3. 效果如何
- 图像分类、分割、检测上的准确率都提升了
- 相比于性能差不多的普通卷积神经网络,GPU速度些许提升,CPU的推理速度大幅提升
4. 还存在什么问题&可借鉴之处
- 这个应该可以直接作为TSN的输入了吧,可能改改TSM也能用,还是通过mmcls实现的,实现起来应该不难。
Backbone - Involution: Inverting the Inherence of Convolution for Visual Recognition相关推荐
- 【Whalepaper】CV论文研读 - Involution内卷:超越Convolution的新算子
Whalepaper是由周郴莲负责的一个每周分享论文的活动,带你研读AI领域的论文,快来一起开源学术科研吧! NLP 论文分享:每周日 晚上 九点 CV 论文分享: 每周日 晚上 九点 Res 论文分 ...
- CVPR 2021 | Involution:超越 Convolution 和 Self-attention 的神经网络新算子
本文是对我们CVPR 2021被接收的文章 Involution: Inverting the Inherence of Convolution for Visual Recognition的解读,同 ...
- CVPR'21 | Involution:超越convolution和self-attention的神经网络新算子
进入公众号,在消息对话框 回复[CVPR2021]即可获取CVPR2021最新论文集 来源:我爱计算机视觉 本文是对我们CVPR 2021被接收的文章 Involution: Inverting th ...
- CVPR‘21 | Involution:超越convolution和self-attention的神经网络新算子
本文是对我们CVPR 2021被接收的文章 Involution: Inverting the Inherence of Convolution for Visual Recognition的解读,同 ...
- 超越卷积、自注意力机制:强大的神经网络新算子involution
视学算法发布 转载自:机器之心 作者:李铎 这篇工作主要是由我和SENet的作者胡杰一起完成的,也非常感谢HKUST的两位导师 陈启峰和张潼老师的讨论和建议. 本文是对我们CVPR 2021被接收的文 ...
- 最强!超越卷积、自注意力机制:强大的神经网络新算子involution
点上方计算机视觉联盟获取更多干货 仅作学术分享,不代表本公众号立场,侵权联系删除 转载于:机器之心,李铎 AI博士笔记系列推荐 周志华<机器学习>手推笔记正式开源!可打印版本附pdf下载链 ...
- 本周AI热点回顾:和欧阳娜娜一起搞研发?强大的神经网络新算子involution,超越卷积、自注意力机制!...
点击左上方蓝字关注我们 01 我和欧阳娜娜一起搞研发 AI新闻播报,开车明星导航,现如今根据文本生成语音的AI技术,那真是飞入寻常百姓家--见怪不怪了. 在这档口, ...
- 超越卷积、自注意力机制:强大的神经网络新算子involution(连算子都内卷= =)
这篇工作主要是由我和SENet的作者胡杰一起完成的,也非常感谢HKUST的两位导师 陈启峰和张潼老师的讨论和建议. 本文是对我们CVPR 2021被接收的文章 Involution: Invertin ...
- CVPR 2021 | 真内卷!Involution:构建新一代视觉识别网络
点击下方卡片,关注"CVer"公众号 AI/CV重磅干货,第一时间送达 本文转载自:AI人工智能初学者 | 作者:ChaucerG Involution: Inverting ...
- Involution:新神经网络算子(CVPR2021 论文速读)
论文链接:https://arxiv.org/abs/2103.06255 github代码链接:https://github.com/d-li14/involution 一.介绍 Involutio ...
最新文章
- 苹果8怎么投屏到电视_苹果电脑电视不在一个房间可以投屏
- Spring Boot集成JPA的Column注解命名字段无效的问题
- python调用rust_在 Rust 代码中编写 Python 是种怎样的体验?
- [转]HDFS用户指南(中文版)
- 例题 3-5 生成元 digit generator
- github的gh-pages分支展示项目页面
- centos安装wget_宝塔是干什么的?3分钟教会你云服务器上安装宝塔面板
- Dijkstra算法图解
- biopython有什么用_用Biopython解析BLAST结果
- C语言打印出心形表白,初学C语言也能看懂!!
- python 断言方法_Python3断言
- 通俗讲解光线追踪原理,一文理清各类光线追踪
- 英语语法-----一般现在时
- CSDN钱包提现协议
- 水表188协议测试软件,水表下行通信规约标准188协议-V1.5标准版.pdf
- WPF使用Blend
- Motion Planning中的问题与挑战
- 奥鹏计算机基础计算机病毒是指,奥鹏教育《计算机应用基础》在线考核A卷.doc...
- 字母序列号生成 A...Z..AA..ZZ....
- http返回码301、302、307、305含义和区别