Paper Reading - Model系列 - LiteHRNet
Abstract
更多关注
计算机视觉-Paper&Code - 知乎
paper code
paper
- HRNet由微软亚洲研究院和中科大提出,已发表于CVPR2019
- 王井东 IEEE fellow 目前已经加入百度AIGroup作为CV首席架构师,主要研究领域为姿态估计、分割检测工业界学术界大牛。
- 回顾上次分享的HRNet,在保持高分辨和高语义信息下虽然得到了很好的效果,但是没有下采样阶段,模型复杂度高,部署困难的问题。对此团队继续推出了轻量化的LiteHRNet
总结来说文章主要以下创新贡献
- 借鉴Shuffle Block, 使用SB代替了原先的RB, 使用depthwise卷积代替fuse layer中的传统卷积,得到Naive Lite HRNet,大大减少计算量
- 提出并使用Conditional Channel Weighting操作代替第一点中提到的1*1 pointwise卷积得到LiteHRNet
Related Work
ShuffleNet
ShuffleNet主要通过以下三个操作来修改residual block,详见子韵如初:Paper Reading - Model系列 - ShuffleNet
- channel shuffle
- pointwise group convolutions
- depthwise separable convolution
Mediating spatial information loss
传统encoder-decoder架构下都需要从低分辨率中恢复空间信息,类似SegNet则会去对不同分辨率的输入采用不同的计算,以降低整体复杂性。BiSeNet通过采用两个分支网络去将细节信息和上下文信息整合起来。HRNet则一直保持着高分辨率特征图
Convolutional weight generation and mixing
该领域主要通过动态生成以输入为条件的conv kernel。常见的几个工作方向为
- MetaNet采用元学习器来生成权重以学习跨任务知识。SOLOV2将此设计应用于实例分割任务,为每个实例生成mask sub-network的参数
- SENet使用全局信息来激发或抑制channel的权重。(详见子韵如初:Paper Reading - 模型结构系列 - The Last Champion Squeeze-and-Excitation)
- CBAM相比为se的channel attention还利用了空间注意力来细化特征。
- 本文的conditional channel weighting可以被视为conditional channel-wise 1 × 1 convolution。大大减少了计算量,还能够跨通道交换信息。
Conditional architecture
Dilated/Deformable Convolution 、SkipNet等能通过利用逻辑可控制来动态决定网络结构的宽度、深度、kernals
空洞卷积,不通过pooling下采样就能得到更大的感受野
相比传统卷积,deformable可形变卷积需要自适应学习每个像素点的采样点的offset,根据偏移量进行采样然后加权求和得到feature map
如图dialted rate 分别为1,2,4
deformable conv
Algorithm
Naive Lite-HRNet
- 将stem中第二个3*3卷积替换为dwconv
- 把所有残差block都替换为shuffleblock
- 在fuse layer中的卷积都替换成可分离卷积
LiteHRNet
想要进一步优化,难题就是如何替换掉占大部分算力的1*1卷积了
1*1卷积主要是为了跨通道交换信息,因此同样替换为深度卷积对跨通道的信息交换没有影响
文章提出Conditional channel weighting,该方法复杂度与通道数成线性关系,并且低于pointwise卷积的二次时间复杂度。不同于常规卷积的权重作为模型参数学习,该模块的权重以输入特征图为基础,通过轻量级模块跨通道计算得到。同时基于HRNet模块能得到跨分辨率和跨通道的信息
其中Conditional channel weighting可分为以下两个操作:
- Cross-resolution Weight Computation. 对于第s个分支中位置i处的特征值,计算公式为:
- Spatial Weight Computation, 同样对于s分支为
总体block实现如图
Experiment
在保证性能的情况下FLOPs明显减少
值得一提的是,作者继续做了消融实验,使用文章提出的模块替换 其他网络的1×1 卷积,也得到了不错的结果
Coding[WIP]
Paper Reading - Model系列 - LiteHRNet相关推荐
- Paper Reading - Model系列 - ShuffleNet Chanel Attention
ShuffleNet: An Extremely Efficient Convolutional Neural Network for Mobile Devices Paper 更多可见计算机视觉-P ...
- Paper Reading - HRNet 系列
更多可关注 计算机视觉-Paper&Code - 知乎 先更新HRNet系列第一篇,留坑,炼丹的人命名都很奇怪,HRNet还以为是人力总监发的呢,OCRNet跟OCR文字识别又扯不上边,欢迎大 ...
- Paper Reading - 基础系列 - 常用评价指标 ROC、PR、mAP
更多可见计算机视觉-Paper&Code - 知乎 目录 混淆矩阵 (Confusion Matrix) 查准率/精确率 Precision 召回率/检出率/查全率 Recall 过杀率 Ki ...
- Paper Reading - 综述系列 - Hyper-Parameter Optimization(下)
更多可见计算机视觉-Paper&Code - 知乎 目录 搜索策略 网格搜索 随机搜索 贝叶斯优化 结论 接着上一篇继续说 搜索策略 网格搜索 将每个超参数的搜索空间离散化为笛卡尔积.然后使用 ...
- Paper Reading - 基础系列 - Accurate, Large Minibatch SGD: Training ImageNet in 1 Hour
更多可关注 计算机视觉-Paper&Code - 知乎 Abstract 恺明出品必属精品,目前在Facebook AI Research,多的不用多说.可以说这篇17年的论文即使到现在也绝不 ...
- [paper reading] YOLO v1
[paper reading] YOLO v1 GitHub:Notes of Classic Detection Papers 本来想放到GitHub的,结果GitHub不支持公式. 没办法只能放到 ...
- [paper reading] FCOS
[paper reading] FCOS GitHub:Notes of Classic Detection Papers 2020.11.09更新:更新了Use Yourself,即对于本文的理解和 ...
- [paper reading] CenterNet (Object as Points)
[paper reading] CenterNet (Object as Points) GitHub:Notes of Classic Detection Papers 2020.11.09更新:更 ...
- [paper reading] CornerNet
[paper reading] CornerNet GitHub:Notes of Classic Detection Papers 本来想放到GitHub的,结果GitHub不支持公式. 没办法只能 ...
最新文章
- *args and **kwargs in Python 变长参数
- 【Linux】4_基本权限ACL的命令(setacl和getacl)
- 为什么中国程序员水平一直上不了层次?无非是这些原因!
- 图片 存_早安图片 早上好问候语 早上好祝福语录大全 早上好表情
- Java枚举益智游戏
- 大三学生独自破解逆天AI模型:我只是把撩妹的时间,都用来研究机器学习了...
- python自我复制的程序_Python自我
- HSRP热备份路由协议配置详解
- Python文件运行时报TabError: inconsistent use of tabs and spaces in indentation
- MyEclipse配色
- 关于1931CIE——XYZ色坐标图转换到RGB色坐标关系
- 京东VS淘宝:待付款订单-再次支付方案对比
- html旋转木马 代码,JavaScript实现旋转木马轮播图
- 【TCP拥塞控制算法(TCP congestion control algorithm)学习笔记】
- 服务器解决了什么问题、状态同步和帧同步
- 电脑计算机软件硬盘不足,电脑硬盘空间不足怎么办?两个方法帮你解决
- nginx redmine_Ubuntu / Redmine / Nginx / Mongrel / Supervisord
- 京挑客好推广步骤注意事项
- 示波器RIGOL DS1102E
- php 代码合并成一个文件,在PHP中将多个PDF文件合并为一个
热门文章
- 密度峰值聚类算法介绍(DPC)
- STM32白话文教程(三)内置按键模块、外接按键检测 三句话让你玩明白按键 水银倾斜模块
- M1芯片安装CocoaPods问题
- 项目管理应树立“三种理念”(转)
- CC, TBD, EOD都是什么鬼?拯救一写英文邮件就发慌
- Odoo | 基础 | 初识系统-ORM之字段属性对象Field
- 计算机英语第三版答案 司爱侠,计算机专业英语教程(第3版)宋德福_司爱侠_练习参考答案...
- No result defined for action com.frank.action.RegistAction and result success
- 可集成在XPage中的谷歌地图控件
- 深入理解JVM-GC