论文题目:U-Net: Convolutional Networks for Biomedical Image Segmentation

论文地址:https://arxiv.org/pdf/1505.04597v1.pdf

医学图像处理方向,U-Net可以说是一个更加炙手可热的网络,基本上所有的分割问题,都可以尝试用U-net看看效果,这在阿里天池比赛中,经常被用到。

论文通过数据增强使得有限且宝贵的的训练集利用的更加充分。
U型结构使定位准确,解决了医学图片的定位,而不是简单的二分类。

U-Net整体的流程是编码和解码(encoder-decoder),而这个过程早在2006年就被Hinton大神提出来发表在了nature上。当时这个结构提出的主要作用并不是分割,而是压缩图像和去噪声。这个思路也可以用在原图像去噪,做法就是在训练的阶段在原图人为的加上噪声,然后放到这个编码解码器中,目标是可以还原得到原图。

问题1:降采样和上采样有什么用?
它可以增加对输入图像的一些小扰动的鲁棒性,比如图像平移,旋转等,减少过拟合的风险,降低运算量,和增加感受野的大小。升采样的最大的作用其实就是把抽象的特征再还原解码到原图的尺寸,最终得到分割结果。


问题2:复制+剪切特征图的作用?
浅层网络会保留明显的内容信息,网络层越深,内容会减少,特征会增多,为了在深层网络添加内容的信息,故有此操作。

问题3:u-net存在卷积层但是没有全连接层?
利用卷积层提取特征,获取每个像素点的信息,通过重叠结果,可以完美对任意大小图分隔,也可以通过镜像图片,对图片的边界上的元素进行预测。

问题4:训练的相关参数?
Caffe框架,采用SGD传播,每个batch一张图片,动量选0.99,采用交叉熵损失+softmax,函数形式:

ak(x)表示每一像素点(x)对应特征通道(k)的得分
K是类的数量 ,pk(x)是类k的对像素点x的分类结果 ,使得最有可能的结果最大化,同时抑制其他类别的概率。

带权重惩罚:

l是每个像素点的真实标签
w 是权重图,区分每个像素点的权重。

为了补偿某一类别的不同像素点的频次差异,用GT样例对w权重图进行预先计算。让网络学习区分更小的边界。

问题5:权重具体怎么算呢?
公式如下:

ωc:Ω→R是用来平衡 某一类 频率的权重图
d1:Ω→R表示到背景的某个像素点到最近细胞边界的距离
d2:Ω→R表示到背景的某个像素点到第二近的细胞边界的距离
设置ω0=10,σ≈5个像素

距离越远,w0exp(-)越小,几乎为0,所以你看到的远离细胞的地方,基本上权值都是一样的,接近于Wc。离细胞越远,权重就越小,相反,边界上的像素点的权重就越大,容易区分相邻细胞且相同细胞的边界。

使用高斯分布初始化权重,标准差为,其中N表示一个神经元的输入节点是的数量,如,对于一个3x3的卷积,前一层有64个feature channel,那么N=9∗64=576

问题6:图片增强操作?

作者做了 平移、旋转、形变、灰度处理,尤其是随机形变起到了重要作用。
使用随机位移矢量在粗糙的3×3网格上生成平滑变形。位移矢量是从标准差为10的高斯分布中采样的。然后使用双三次方插值计算每个像素位移。contracting path最后的dropout也起到了数据增强的作用。

实验对比结果:

【深度学习】U-Net简介相关推荐

  1. DL:深度学习(神经网络)的简介、基础知识(神经元/感知机、训练策略、预测原理)、算法分类、经典案例应用之详细攻略

    DL:深度学习(神经网络)的简介.基础知识(神经元/感知机.训练策略.预测原理).算法分类.经典案例应用之详细攻略 目录 深度学习(神经网络)的简介 1.深度学习浪潮兴起的三大因素 深度学习(神经网络 ...

  2. 深度学习及TensorFlow简介

    深度学习及TensorFlow简介 深度学习目前已经被应用到图像识别,语音识别,自然语言处理,机器翻译等场景并取得了很好的行业应用效果.至今已有数种深度学习框架,如TensorFlow.Caffe.T ...

  3. 深度学习和Keras 简介

    随着近年来人工智能(AI)技术的大热,相信读者们对"人工智能""机器学习" 和"深度学习"这几个词汇已经耳熟能详.那么,这三者之间是什么关系 ...

  4. 1-2 李宏毅2021春季机器学习教程-第一节(下)-深度学习基本概念简介

    上篇文章1-1 李宏毅2021春季机器学习教程-第一节(上)-机器学习基本概念简介介绍了回归的一些知识,重点介绍了机器学习寻找函式的三个步骤.接着我们继续学习第一节Introduction的内容. 目 ...

  5. yolo 深度学习_YoLo v1-v3深度学习网络-结构简介

    引言:如今基于深度学习的目标检测已经逐渐成为自动驾驶,视频监控,机械加工,智能机器人等领域的核心技术,而现存的大多数精度高的目标检测算法,速度较慢,无法适应工业界对于目标检测实时性的需求,这时YOLO ...

  6. 什么是深度学习?kears简介,深度学习常用的三大模型,MLP(多层感知机),CNN(卷积神经网络),RNN(循环神经网络)

    什么是深度学习? 简单理解深度学习就是人类容易做的事情,机器不容易完成的事情.(实例:人脸识别,这个例子很好的证明了这句话.假如你识别一个人 ,今天这个人长这个样子,明天脸上有一块伤口,我们人是不是还 ...

  7. 移动端深度学习框架——绝影简介

    绝影(Prestissimo) 绝影是九言科技开发的高性能移动端深度学习框架,其项目地址见 https://github.com/in66-dev/In-Prestissimo 背景 绝影前身是一个G ...

  8. 深度学习平台——PaddleCloud简介

    摘要 PaddleCloud能够帮助您一键发起深度学习任务,为您提供免费底层计算资源.或提供快速打通云上计算资源通道,支持您快速发起单机/分布式Paddle框架训练任务,致力于推动AI应用更广泛地落地 ...

  9. TVM(端到端深度学习编译器)简介

    TVM-算子编译器前后端 前言 TVM 出现背景 TVM是什么 为什么用TVM,TVM解决了什么 当前问题: TVM解决了 TVM如何解决 具体实现手段 如何设计搜索空间Search Space 优化 ...

  10. 【DL with Pytorch】第 1 章 :深度学习与PyTorch简介

最新文章

  1. go var type 互转_Go语言学习笔记(第九章) 结构体
  2. Vue学习小札——2.6 组件参数校验与非props特性
  3. JavaScript_BOM_window
  4. jQuery中的队列是什么?
  5. OSI七层模型加协议
  6. delete expired backup 和 delete obsolete
  7. python列表求平均值_python与统计概率思维
  8. SpringBoot集成Druid不支持多条SQL
  9. 消息人士:苹果要求代工商今年生产9000万部iPhone 13
  10. P1510 精卫填海
  11. JAVA day27,28 线程池
  12. .NET四种注释规范
  13. Android项目实战(二):安卓应用程序退出的三种方法
  14. Android SurfaceView概述
  15. 金盾加密视频破解翻录限制工具使用教程
  16. Linux下安装flash player插件
  17. 波士顿大学计算机硕士排名,波士顿大学计算机工程研究生排名重点消息重点解析...
  18. Nginx:配置 proxy_pass 代理转发
  19. Qt按键键值 与 相关字符串 的映射表
  20. 在matlab神经网络中xite,神经网络的MATLAB实现苏析超

热门文章

  1. STM32F407与CS5531、CS5532、CS5533、CS5534通信程序解析
  2. fpga驱动步进电机转动指定角度_通过PLC实现步进电机定位控制的方法
  3. 我能够入职世界顶尖的卡巴斯基,却被国内的安全公司拒之门外
  4. 计算机本科生毕业设计题目(三)
  5. cameraLink
  6. 汇编语言集成编译器android,辰灿汇编语言集成开发环境
  7. matlab交流电路仿真,单相交流调压电路Matlab仿真
  8. 存储基础知识 - 网络存储主要技术
  9. kali扫描内网ip_kali 局域网嗅探
  10. python100内的质数_python输出100以内的质数与合数