Unet++论文解读
论文地址:https://arxiv.org/pdf/1807.10165.pdf
作者知乎解读:https://zhuanlan.zhihu.com/p/44958351(推荐先看这篇解读,作者做研究的态度和方式我非常赞同,我自己也是这样做的,觉得比较有效,而且容易激起自身的研究兴趣)
接下来,我总结了作者研究的心路历程:
(1)Unet这个三年不动的拓扑结构真的一点儿毛病都没有吗?
我和作者有过同样的思考,这里也同样得出这个结构最优秀的点就在于结合了深浅层特征,而且结合的方式优于FCN(优于FCN这点是我个人的理解)
(2)Unet要多深合适?
这点和作者解析的很像,并不是所有的问题增加深度就能提高性能。有些问题简单,浅层网络就能解决,增加深度并不能增加效果。有些问题难,就需要深层网络,毕竟需要将问题抽象的更猛烈些
(3)降采样对于分割网络到底是不是必须的?
这一点我认为除了作者所说的增加鲁棒性,轻微的旋转不变性,减少训练参数等原因。其实也有为了能增加卷积网络深层的原因,还有增加感受野的原因。
(4)所抓取的特征都很重要,为什么我非要降16倍了才开始上采样回去呢?
这个问题的解答其实和第一问很相似。并不是非要降低16倍,而是根据自身问题的难度选择降低的倍数。更简明的说,就是你选区多少层,这个你得试试。
(5)如何有效解决梯度回传的问题?
这个梯度回传是针对上面这幅图的,这不是unet++的完整结构。从这幅图可以看出,如果只用最后的那个x0,4来计算最终的loss,那么红色三角这块就不会对网络有贡献,也就是梯度回传不会流过红色三角区域。为了缓解这个问题,就想到了2中方式:(1)中间添加短链接;(2)为x0,1和x0,2和x0,3都与真实值比较,都有一个loss,那么这块红色三角就对网络有了贡献。
(6)仅仅通过各层之间的短连接,能否有效融合深浅层特征?
这个是针对第(5)问的第一个解决方法思考的,具体如上图所示。从图中可以看出,只有短链接,没有长连接,那么前面的特征似乎还是没用起来,那么就想到了dense的想法,将前层的内容都加到一起 ,完美。具体如下图:
(7)Unet++网络比U-Net效果好,但是这个网络增加了多少的参数,加粗的参数可都是比U-Net多出来的啊?是不是通过增加参数就能达到Unet++的能力?
还真不是,这个其实涉及一个问题,那就是网络对特征的利用程度,这个就是unet的深浅层特征融合的想法。是不是感觉有点驴头不对马嘴,那是因为单纯的增加参数,有时并不能增加网络的能力,这就是由于网络对于特征的利用程度很有限,或者由于现如今优化方式的限制导致某种结构的网络只能达到一定的性能,增加参数也无用。所以能得出Unet++的结构更好,更能利用特征。
(8)为浅层增加loss真的好吗?也就是在训练过程中在各个level的子网络中加了这种深监督,可以带来怎样的好处呢?
我个人自己做过一点实验,我并不认为会达到最优。虽然你使得梯度能更好的回传,但为前面的网络层添加了约束,可能最后一层得到的结果是有它自己的参数形式,但你增加了一个强约束,使得它这个较优的参数形式被破坏,使得结果变差。但我不否认这种做法的一个有点,那就是网络收敛很快,减少了训练时间。
我个人不是特别喜欢这种加loss的做法,或者说我认为就这么简单增加loss,非常的不好,感觉可以有更好的加loss的方式。
(9)剪枝三联问?
为什么UNet++可以被剪枝
如何剪枝
(为什么要在测试的时候剪枝,而不是直接拿剪完的L1,L2,L3训练?怎么去决定剪多少?)好处在哪里
被剪枝其实就是因为网络中间层就能得到最终结果。
就减去最外层的一排。
好处就是减少参数的同时还能保证一定的性能。
参考:
https://zhuanlan.zhihu.com/p/44958351
Unet++论文解读相关推荐
- Unet论文解读代码解读
论文地址:http://www.arxiv.org/pdf/1505.04597.pdf 论文解读 网络 架构: a.U-net建立在FCN的网络架构上,作者修改并扩大了这个网络框架,使其能够使用很少 ...
- 从单一图像中提取文档图像:ICCV2019论文解读
从单一图像中提取文档图像:ICCV2019论文解读 DewarpNet: Single-Image Document Unwarping With Stacked 3D and 2D Regressi ...
- CVPR 2018 论文解读集锦(9月26日更新)
本文为极市平台原创收集,转载请附原文链接: https://blog.csdn.net/Extremevision/article/details/82757920 CVPR 2018已经顺利闭幕,目 ...
- 2015-FCN论文解读
文章目录 FCN论文解读 1. 简介 1.1 什么是语义分割??? 1.2 FCN 结果 2. 全卷积网络(3个创新点) 2.0 传统的CNN在做语义分割存在的问题 2.1 全卷积网络 2.1.1 F ...
- 论文解读| NeurIPS 2022:面向科学任务的图神经网络设计
点击蓝字 关注我们 AI TIME欢迎每一位AI爱好者的加入! 近日中国人民大学高瓴人工智能学院师生有23篇论文被CCF A类国际学术会议NeurIPS 2022录用.神经信息处理系统大会(Neura ...
- DeepLabV3论文解读(空洞卷积/膨胀卷积 理解)
DeepLabV3论文解读(空洞卷积/膨胀卷积 理解) 最近在做基础网络研究,设计的网络结构除了在分类数据集上测试,还需要在分割和检测网络上测试效果,故选择了DeepLabV3作为对比平台.本想直接替 ...
- CVPR 2018 论文解读集锦
之前我们整理过视觉顶级会议CVPR2017的论文解读文章 和ICCV 2017 论文解读集锦,CVPR 2018已经公布了所有收录论文名单,为了能够让大家更深刻了解CVPR的论文,我们进行了一些CVP ...
- CVPR 2018 论文解读(部分)
CVPR 2018还有3个月就开始了,目前已经公布了所有收录论文名单,为了能够让大家更深刻了解CVPR的论文,我们进行了一些CVPR 2018论文解读的整理,后续还会持续更新. 1.CVPR2018| ...
- Learn to See in the Dark 论文解读
整理下最近一篇论文的学习笔记.这是由UIUC的陈晨和Intel Labs的陈启峰.许佳.Vladlen Koltun 合作提出的一种在黑暗中也能快速.清晰的成像系统,让机器"看破" ...
最新文章
- 正则表达式中re.S是什么意思?有什么作用?
- vue开发环境和生产环境里面解决跨域的几种方法
- 学java时的一些笔记(2)
- stm32 IO口模式的寄存器配置
- docker logs 查看docker容器日志
- 利用GPU训练网络时遇到的一些问题
- JavaScript高级程序设计(第三版)学习笔记1~5章
- Eclipse上Maven环境配置使用
- ServerSuperIO Designer IDE 发布,打造物联网通讯大脑,随心而联。附:C#驱动源代码。
- mysql 可视化监控_基于Prometheus构建MySQL可视化监控平台
- grdraw用法 lisp_AutoCAD 2000 Visual LISP开发
- java 数学公式解析_JAVA 文本表达式解析成数学公式,计算出结果
- java 宿舍管理系统教学,java学校宿舍管理系统
- zmap扫描mysql_zmap/masscan 快速扫描网络
- python 读写西门子PLC 包含S7协议和Fetch/Write协议,s7支持200smart,300PLC,1200PLC,1500PLC...
- android timepicker 设置颜色,android TimePicker 踩过的坑 颜色设置
- 2013年放假安排时间表 法定节假日安排通知 ( IS2120@BG57IV3)
- 《Erlang/OTP并发编程实战》第八章 分布式 Erlang/OTP 简介
- 从零开始手写 VIO
- 用无线网卡做wifi热点共享网络的方法
热门文章
- GEE:实现 Lee 杂波滤波器(Lee speckle filter)降低或去除SAR图像中的杂波(speckle noise)
- 溢出处理html,小技巧处理div内容溢出_CSS/HTML
- Java 8 入门教程 - Streams(流)
- 【python ACM 输入输出的处理:sys.stdin.readline().strip().split())】
- 《淘宝网开店 进货 运营 管理 客服 实战200招》——1.7 网上开店为什么会失败...
- Android源码学习——linker(4)
- ckeditor3.0.1上传图片功能(.net版本)
- 每天一点数据库之-----Day 2 创建与管理数据库表
- 我,30岁,机械工程,转行互联网成为我这辈子做过最好的决定
- 微软Win10轻松转换MBR为GPT官方教程