《Densely Connected Convolutional Networks》论文心得
《Densely Connected Convolutional Networks》论文心得
作者及其所在团队在国内外相关领域所处水平:
黄高:美国康奈尔大学计算机系博士后主要研究领域为深度神经网络的结构设计与优化算法,以及深度学习在计算机视觉与自然语言理解中的应用。目前已发表学术论文20余篇,被引用次数达1000余次;其中一篇综述论文被中国科学技术信息研究所评选为2015年全国百篇最具国际影响学术论文;会议论文“Densely ConnectedConvolutional Networks”获得国际计算机视觉顶级会议CVPR的最佳论文奖。
个人主页:http://www.gaohuang.net/
刘壮:清华大学姚班本科生,以共同第一作者身份发表的大会论文Densely Connected Convolutional Networks(《密集连接的卷积神经网络》)获得了会议最佳论文奖。
Laurens van der Maaten:Facebook人工智能研究院研究员FAIR 的研究人员在众多国际顶级会议中得到了认可,比如在 ACL、EMNLP、CVPR、ECCV 中得到了最佳论文奖,在 ECCV、ICML 和 NeurIPS 得到了时间检验奖项。
Kilian Q. Weinberger:康奈尔大学教授,团队主页:http://www.cs.cornell.edu/~kilian/research/multitasklearning/multitasklearning.html
问题解决:
在一定程度上缓解了梯度消失的问题,加强了特征传播,使得网络变得更深,采用更少的计算达到更高的性能。
论文贡献:
论文提出了一种能够在加深网络的同时缓解梯度消失的策略,并且能够在加深网络同时加强特征的传播以及尽可能的减少参数量,使得更深、准确率更高的网络成为了可能。
论文思想基础:
1:保证最大的信息量在所有层之间进行传递。
2:将所有层的信息进行共享。
3:明确区分添加的网络的信息和保存的信息。
4:让每一层可以直接访问来自损失函数和原始输入信号的梯度,产生隐式深度监督。
5:采用密集化连接以达到正则化效应。
论文工作:
1.将所有层进行连接以确保最大的信息量在所有层之间进行传递,但区别于resnet,在特征被传递到层之前不采用求和的方式。
2.将前面所有层所有额外的输入并且将特征映射到后面所有层。
网络细节:
x0为输入,HL(.)为非线性变换,第l层的输出为xL。
传统网络:第L-1层的输出是第L层的输入xL=HL(x(L-1))
Resnets连接: xL=HL(x(L-1))+x(L-1)
Densenet连接: xL=HL([x0,x1,…,x(L-1)])
feature map: 每个HL输出 k个feature map,,那么第l层的feature map输入就为k0 +k *(L-1)。
原Dense block结构: 包含多个子结构,由多个BN-RELU-3✖3的卷积操作构成。
Transition Layer: 在两个Dense block之间采用transition Layer进行连接,起到了降维,减小计算量的作用。其中含有一个参数θ(0≤θ≤1),其表示原通道数缩小的倍率,例如为0.5时被输出传递到下一个Dense Block时通道的数量会被缩减一半。当传递特征图大小相同的Denseblock时,采用1×1卷积的连接方式;当传递特征图大小不同的Dense block时,采用1×1卷积后跟随池化层的连接方式。
Growth rate: k个feature maps个数,并且较小的k能得到很好的结果。
原DenseNet网络结构:
DenseNet网络进阶结构:
DenseNet-B:仅加入bottleneck layers,Dense block转换为BN-RELU-1✖1和BN-RELU-3✖3,1✖1的卷积作为bottleneck layer(线性瓶颈层)起到了降维,减小计算量的作用。。
DenseNet-C:仅加入transition layers,在Dense block之间加入BN+ReLU+1x1 Conv,特征图大小变化时为BN+ReLU+1x1 Conv+2x2 AvgPooling。
DenseNet-BC:同时加入bottleneck and transition layers,Dense block转换为BN-RELU-1✖1和BN-RELU-3✖3同时在Dense block之间加入BN+ReLU+1x1 Conv,特征图大小变化时为BN+ReLU+1x1 Conv+2x2 AvgPooling。
训练策略:
CIFAR-10:batch:64,epochs:300,开始的学习率为0.1,衰减策略为轮数的50%和75%分别除以10。
SVHMV:batch:64,epochs:40,开始的学习率为0.1,衰减策略为轮数的50%和75%分别除以10。
ImageNet:bacthsize:256,epochs:90,学习率也是以0.1开始,到30轮和60轮的时候衰减10倍,采用dropout的方式,丢失率为20%。
程序源码:
https://github.com/liuzhuang13/DenseNet
训练集及测试集:
ImageNet:http://www.image-net.org/
CIFAR-10:http://www.cs.toronto.edu/~kriz/cifar.html
SVHN:http://ufldl.stanford.edu/housenumbers/
未来改进:
1.占用显存过大。
2.深度仍然不能太大。
《Densely Connected Convolutional Networks》论文心得相关推荐
- 【Network Architecture】Densely Connected Convolutional Networks 论文解析
[Network Architecture]Densely Connected Convolutional Networks 论文解析 目录 0. Paper link 1. Overview 2. ...
- 骨干网络之DenseNet:Densely Connected Convolutional Networks论文学习
0.优点 核心就两个模块:dense block ,transition.我看完这篇论文觉得和resnet的思想很想 1.由于他和renet一样都是会在训练的时候提前底层特征所以会避免梯度消失 (re ...
- 深度学习论文翻译解析Densely Connected Convolutional Networks
在开始学习之前推荐大家可以多在FlyAI竞赛服务平台多参加训练和竞赛,以此来提升自己的能力.FlyAI是为AI开发者提供数据竞赛并支持GPU离线训练的一站式服务平台.每周免费提供项目开源算法样例,支持 ...
- Densely Connected Convolutional Networks 阅读
https://blog.csdn.net/u014380165/article/details/75142664 论文:Densely Connected Convolutional Network ...
- 【图像分类】(DenseNet)Densely Connected Convolutional Networks
论文名称:Densely Connected Convolutional Networks 论文下载地址:https://arxiv.org/pdf/1608.06993.pdf 论文代码地址:htt ...
- 论文笔记:Densely Connected Convolutional Networks (2017 CVPR)
[引用格式]:G. Huang, Z. Liu, L. Van Der Maaten and K. Q. Weinberger, "Densely Connected Convolution ...
- 论文笔记:Densely Connected Convolutional Networks(DenseNet模型详解)
[ 转载自http://www.yyliu.cn/post/7cabb4ff.html ] CVPR 2017上,清华大学的Zhuang Liu.康奈尔大学的Gao Huang和Kilian Q.We ...
- Densely Connected Convolutional Networks(论文解读三)
目录 DenseNet:论文解读 1. Abstract 2. Related work 2.1 通过级联来加深网络 2.2 通过 shortcut 连接来加深网络 2.3 通过加宽网络来使网络更深 ...
- 【论文阅读及复现】(2017)Densely Connected Convolutional Networks + Pytorch代码实现
文章目录 一.摘要 二.Dense Net 网络结构 三.Dense Block 四.PyTorch-GPU代码实现 论文来源:(2017)Densely Connected Convolutiona ...
最新文章
- window resize和scroll事件的基本优化
- KlayGE SVN原生支持立体显示
- 深入出不来nodejs源码-编译启动
- display(block,inline,none),visibility(visible,hidden)之间的关系及区别(不同)
- python基础-分支判断语句(4)
- 存到mysql的中文乱码_将用户输入的中文保存到数据库出现中文乱码问题
- load data详解
- P3959-宝藏【模拟退火】
- 学php要懂js吗,js要怎么学
- mysql中timestamp的自动生成与更新
- Web前端开发最佳实践(7):使用合理的技术方案来构建小图标
- java 姓名生成器_java自动机器人自动生成修姓名工具类
- html5画布获取位置,html5画布绘制位置不正确(html5 canvas drawing position not correct)
- 5G 产业链重要细分投资领域
- C#应用程序界面开发基础——窗体控制(6)——菜单栏、工具栏和状态栏控件
- oracle千万级数据量的表关联更新
- 2020复工后刷脸支付将迎来高潮
- 解决网络延迟200ms问题
- 武汉服务器维修哪里专业报价,入门服务器 武汉IBM X3100报价5500元
- 惠普服务器全系列,惠普全系列四核服务器
热门文章
- Python 封闭科赫曲线绘制
- cacti mysql 修复_cacti数据库修复
- 数学建模系列笔记3:预测和相关分析
- FreeBSD--如何最有效率的安装软件
- Mac,Windows和Linux系统都能读写移动硬盘的方法
- Metalink Account
- PPTX机械危害预防手册(45页)(附下载)
- 后台管理界面-- 管理员管理[4]
- Win7系统出现提示: “Windows已遇到关键问题,将在一分钟后自动重新启动。”...
- blazor+localstorage