【计算机视觉】图像分割中FCN、DeepLab、SegNet、U-Net、Mask R-CNN等算法的讲解(图文解释 超详细)
觉得有帮助请点赞关注收藏~~~
一、FCN分割算法
全卷积神经网络目标分割算法能够端到端的得到每个像素的目标分类结果,与传统的卷积神经网络只能输入固定大小图像和在网络的末端使用几个全连接层得到固定长度的特征向量不同,全卷积神经网络能够接受任意大小尺寸的输入图像,并且网络中没有使用全连接层,而是全部使用卷积层,全卷积神经网络采用反卷积层取代简单的线性插值算法,对最后一个卷积层的特征图进行上采样,使用反卷积可以对卷积进行逆操作
FCN算法采用VGGNet为基础网络,并把VGGNet的最后三层全连接层改为卷积层,最后采用跳跃式结构融合多尺度特征产生与原图大小一致的每个像素图类别图
二、DeepLab图像分割算法
DeepLab图像分割算法主要由两部分所组成:深度卷积神经网络和条件随机场,该方法的主要创新点就是条件随机场部分,该方法的主要创新点就是条件随机场部分,为了能够取得类似于传统条件随机场的全局优化效果,利用循环的方式将上一层的输出作为下一层的输入,其中采用的条件随机场架构是基于全局连接模型,图像分割的条件随机场推理的关键因素就是将类别标号问题转变成概率推理问题。
DeepLab分割算法将条件随机场作为后置的处理加在全卷积神经网络的结果上,用来改善图像分割的结果,这种通过将全卷积神经网络与条件随机场组合得到了较好的结果
三、SegNet图像分割算法
SegNet图像分割算法是一个编码器-解码器结构的卷积神经网络,SegNet算法结果如下图,这是一个对称网络,左边是卷积提取高维特征,卷积后不改变图片大小,通过池化来使图片变小,该部分为编码器部分,右边是反卷积与上采样,上采样使用的使反池化的方式将图像变大,通过反卷积使上采样后的图像信息变得丰富,使得在池化过程丢失的信息可以在学习后得到
SegNet中的池化层多了一个索引的功能,在每次进行最大池化的过程中都会保存滤波器中最大权值的相对位置,在利用反池化的方式进行上采样的时候就能对最大权值的区域信息进行恢复,其余信息则会丢失,因此,SegNet使用可学习的反卷积将缺失的内容进行填充。
四、U-Net算法
U-Net是受到FCN启发针对医学图像做语义分割,且可以利用少量的数据学习到一个对边缘提取十分鲁棒的模型,在生物医学图像分割领域有很大作用,大体由收缩和扩张路径组成,因为形似一个字母U,得名U-Net,收缩路径利用传统卷积神经网络的卷积池化组件,其中经过一次下采样之后从层数变为原来的2倍,扩张路径由2×2的反卷积实现,反卷积的输出通道为原来通道数的一半,与原来的特征图串联,从而得到和原来一样多的通道数的特征图
U-net与其他常见的分割网络有一点非常不同的地方:U-net采用了完全不同的特征融合方式:拼接,U-net采用将特征在层(channel)的维度拼接在一起,形成更厚的特征。而FCN融合时使用的对应点相加,并没有形成更厚的特征。
五、Mask R-CNN算法
它是一个小巧 灵活的通用对象实例分割框架,它不仅可对图像中的目标进行检测,还可以对每一个目标给出一个高质量的图像分割结果,取得了十分不错的结果
如图4-7所示,Mask R-CNN分为两个分支:
(1)第一个分支为原始Faster R-CNN的结构,它用于对候选窗口进行分类和窗口坐标回归。
(2)第二个分支对每一个感兴趣区域(Region of Interest,RoI)预测分割掩模,这个分支采用了图像分割的经典算法-FCN结构。
创作不易 觉得有帮助请点赞关注收藏~~~
【计算机视觉】图像分割中FCN、DeepLab、SegNet、U-Net、Mask R-CNN等算法的讲解(图文解释 超详细)相关推荐
- 【Keras+计算机视觉+Tensorflow】生成对抗神经网络中DCGAN、CycleGAN网络的讲解(图文解释 超详细)
觉得有帮助麻烦点赞关注收藏~~~ 一.生成对抗网络简介 生成对抗网络(GANs,Generative Adversarial Nets),由Ian Goodfellow在2014年提出的,是当今计算机 ...
- 【云计算与大数据技术】分布式数据库NoSQL中KV、列式、图、文档数据库的讲解(图文解释 超详细)
一.NoSQL数据库概述 NoSQL泛指非关系型数据库,相对于传统关系型数据库,NoSQL有着更复杂的分类,包括KV数据库,文档数据库,列式数据库以及图数据库等等,这些类型的数据库能够更好的适应复杂类 ...
- Android Studio App开发之网络通信中使用POST方式调用HTTP接口实现应用更新功能(附源码 超详细必看)
运行有问题或需要源码请点赞关注收藏后评论区留言~~~ 一.POST方式调用HTTP接口 POST方式把接口地址与请求报文分开,允许使用自定义的报文格式,由此扩大了该方式的应用场景.POST请求与GET ...
- 【Android App】人脸识别中使用Opencv比较两张人脸相似程度实战(附源码和演示 超详细)
需要全部代码请点赞关注收藏后评论区留言私信~~~ 一.比较两张人脸的相似程度 直方图由一排纵向的竖条或者竖线组成,横轴代表数据类型,纵轴代表数据多少. 图像直方图经常应用于特征提取.图像匹配等方面. ...
- 计算机视觉——图像分割(上篇)
[本学期选修国科大高伟老师的计算机视觉课程,本人方向也是cv,因此想通过博客方式记录课程中比较重要的点,巩固并且进行一些扩展学习] [本章节内容针对图像分割进行讲解] 接下来我们将主要针对以下内容进行 ...
- 图像分割中mask的保存
在图像分割中,最后的输出结果mask结果是一个N x W x H的tensor,其中N表示有多少个类别,W是图像的宽度,H是图像的高度,每一个W x H都是一个二值矩阵 第一步,转成numpy中的a ...
- 中图法分类号 计算机视觉方面,中图法分类号tp39中国图象图形学报.doc
中图法分类号tp39中国图象图形学报 中图法分类号:TP391.4 文献标识码:A 文章编号: 论文引用格式: 利用背景加权和选择性子模型更新的视觉跟踪算法 黄安奇,侯志强,余旺盛,刘翔 空军工程大学 ...
- css中如何设置hr的样式?css hr标签多种样式(图文)
在对html网页进行美化的时候,肯定少不了要用的hr标签进行修饰页面,但默认的hr标签样式对页面的修饰起不到什么好的作用,有经验的前端工作者就会通过使用css样式来对hr标签进行一些美化的操作.那么如 ...
- 语义分割中的深度学习方法全解:从FCN、SegNet到各版本DeepLab
语义分割中的深度学习方法全解:从FCN.SegNet到各版本DeepLab 原文:https://www.sohu.com/a/155907339_610300 图像语义分割就是机器自动从图像中分割出 ...
最新文章
- EPSON机械手建立工具坐标系方法
- PostgreSQL在何处处理 sql查询之四十七
- C++ qsort() 函数调用时实参与形参不兼容的问题解决
- vue 同步加载_2019 前端面试题汇总(主要为 Vue)
- Luogu1515 青蛙的约会
- HttpClient4 TIME_WAIT和CLOSE_WAIT
- jQuery课堂测验
- 补:关于man关于SEE ALSO(参见)中代号与vim下常用命令
- POJ2109-Power of Cryptography
- 区块链架构1.0、2.0与3.0梳理
- 2021年中国研究生数学建模竞赛E题参考思路
- linux 历史记录索引_使用Google桌面索引FireFox浏览器历史记录
- OpenCV-Python<八> 图像平滑处理
- 80286/286/Intel286 架构/流水线及其优化
- xheditor的使用
- dell服务器配置信息,DELL服务器配置(710)
- 厉害了!互联网公司各岗位真实工作内容大起底!
- 交互设计师怎样理解信息架构?
- mysql b树子节点个数_MySQL 和 B 树的那些事-爱可生
- 基于微信小程序的国产动漫论坛小程序