链接

https://arxiv.org/abs/1412.6806

摘要

大多数执行目标检测任务的卷积神经网络架构基本都遵循 ( L a y e r c o n v − L a y e r m a x p o o l i n g ) × n + L a y e r f u l l y c o n n e c t i o n × m (Layer_{conv} - Layer_{maxpooling}) \times n +Layer_{fullyconnection} \times m (Layerconv​−Layermaxpooling​)×n+Layerfullyconnection​×m 这样的架构,本文对目前从小图片中进行目标检测的几种性能较好的网络进行重新评估,提出了各种组件是否为必须组件这样的提问。结果发现max-pooling层是可以通过 s t r i d e > 1 stride \gt 1 stride>1 的卷积层来实现的,而且不会带来精度的降低。据此提出了全卷积网络。
为了分析网络,还引入“反卷积方法”来把网络特征可视化。

去掉Pooling层的思路

  1. 比方 w i n d o w = 2 window=2 window=2 的Pooling层,直接去掉,然后在它前面的Conv层用 s t r i d e = 2 stride=2 stride=2 替代,结果是识别的准确率会稍微降低(为什么?)
  2. 用用 s i z e = 3 , s t r i d e = 2 size=3, stride=2 size=3,stride=2 的Conv层替代 w i n d o w = 3 , s t r i d e = 2 window=3, stride=2 window=3,stride=2 的Pooling层,不存在识别准确率降低的问题,但是会导致参数增加(可能会增加过拟合的可能?)注意:除非是参数矩阵 θ \theta θ 有约束条件,否则用Conv层替换Pooling层会增加参数间的依赖(It is worth noting that replacing pooling by convolution adds inter-feature dependencies unless the weight matrix θ \theta θ is constrained)

实验的情况

一般来讲,ALL_CNN_LAYERS的表现更为突出,就是上面提到的第二种情况

结论

  1. 一个只含有Conv层和Subsampling层的网络性能和含有maxpooling层的网络相比,可能差不多甚至更好;
  2. 和之前的观察不一致的是,在网络里显式增加(最大)池化层并不总是提升性能,尤其是对于对于其训练的数据集来说,用卷积层就能学到所有的必要的不变量的网络。

可以借鉴的思路

在Tiny YoloV3里面的MaxPooling Layer里面用 w i n d o w = 2 , s t r i d e = 2 window=2, stride=2 window=2,stride=2 的Conv层替换掉,看看效果(两方面,一方面是准确率,另一方面是推理的时间有没有增加)。

Striving For Simplicity-the All Convolutional Net 笔记相关推荐

  1. 【论文笔记 2】CNN经典入门STRIVING FOR SIMPLICITY: THE ALL CONVOLUTIONAL NET

    [论文笔记 2]CNN经典入门STRIVING FOR SIMPLICITY: THE ALL CONVOLUTIONAL NET 1. 综述 对现代的CNN网络结构进行了简要说明,一般的网络都是由卷 ...

  2. [深度学习论文笔记][Visualizing] Striving for Simplicity: The All Convolutional Net

    Springenberg, Jost Tobias, et al. "Striving for simlicity: The all convolutional net." arX ...

  3. Striving for Simplicity: The All Convolutional Net

    http://arxiv.org/abs/1412.6806 CNN网络貌似由简单到复杂,再由复杂到简单的趋势 当前主流的CNN网络一般都包括以下几个模块:convolution and max-po ...

  4. 《STRIVING FOR SIMPLICITY: THE ALL CONVOLUTIONAL NET》论文学习

    ABSTRCAT 如今用于目标识别的CNNs大都以相同的原则构建:卷积层与最大池化层交替,接着是少量全连接层.本文重新评估了用CNN从小图像中识别物体的技术水平,产生了对上述结构中不同成分的必要性的质 ...

  5. 深度学习的可解释性——Striving For Simplicity: The All Convolution Net

    Striving For Simplicity: The All Convolution Net 是ICLR 2015的一篇论文,作者Jost Tobias Springenberg , Alexey ...

  6. Striving For Simplicity: The All Convolution Net

    Striving For Simplicity: The All Convolution Net 是ICLR 2015的一篇论文,作者Jost Tobias Springenberg , Alexey ...

  7. Striving For Simplicity: The All Convolution Net 简析

    转载[https://blog.csdn.net/qinqbaobei/article/details/54092619] Striving For Simplicity: The All Convo ...

  8. Deformable Convolutional Networks笔记

    目录 1. Introduction 2. Deformable Convolutional Networks Deformable Convolution Deformable RoI Poolin ...

  9. Generating Summaries with Topic Templates and Structured Convolutional Decoders笔记

    用的是卷积解码器,和已知的经典RNN的seq2seq是不同的,有更好的内容覆盖率 一.定义 导言 文档被组织成主题连贯的文本片段,在讨论的内容方面表现出特定的结构 某些主题可能以特定的顺序进行讨论 ( ...

最新文章

  1. 『转』Photoshop中改进ios设计流程的30个诀窍
  2. java实现请求发送_java实现响应重定向发送post请求操作示例
  3. selenium选中某个控件敲击键盘
  4. NYOJ练习题 Splits the string (简单动态规划)
  5. boost::ratio_power相关的测试程序
  6. 奥运奖牌计数(信息学奥赛一本通-T1064)
  7. 工信部:“5G+工业互联网”在建项目全国已超2000余个
  8. 常见的工作流框架 Activity JBPM
  9. 谷歌浏览器永久打开Flash插件
  10. mysql 删除数据 分页_使用limit分页查询时,做delete操作,会导致丢失数据
  11. go包管理之vender机制
  12. 2017年山东省机器人比赛 双足竟步 arduino源代码(删去了关键步态程序 gongneng1 和 gongneng2)
  13. leaflet显示高程
  14. 《黑客与画家》读书笔记(一)
  15. ZOJ 3587 Marlon#39;s String 扩展KMP
  16. 如何在模拟器中安装App
  17. 合肥超导量子计算机,美国研发超导量子计算机所用的变光转换器
  18. Calendar 日历
  19. 展开w ndows文件很慢,(Wndows优化大师的功能和使用方法分析.doc
  20. UMeditor百度富文本编辑器的使用

热门文章

  1. 如何更改电脑的“图片密码”?
  2. 合作模式歌利亚机器人_歌利亚全任务流程图文攻略_歌利亚通关攻略_牛游戏网攻略...
  3. AFG与AWG的比较
  4. 学生学计算机情况调查问卷报告怎么写,学生计算机基础情况了解调查问卷.doc...
  5. 关于如何插入网线(网线没网)的同时连接wifi上网
  6. Jmeter 数据库压力测试
  7. Scenario Runner (CARLA)
  8. gitlab-ci运行参数
  9. 胆固醇-聚乙二醇-叠氮,Cholesterol-PEG-Azide,CLS-PEG-N3,科研试剂供应
  10. C/C++ 实现十六进制转十进制