语义分割介绍和FCN
边缘和一些其他区域忽略了。
数据集是ms coco,这些坐标是两两一组,多边形的节点x坐标和y坐标两两一组。之后再把这个多边形区域转换成右下角的这种形式。
pixel acc的分子是预测正确的像素点个数,分母是这个图片总的像素点个数。
mean acc意思是把每个类别的acc计算出来求和,然后除以类别个数。
mean iou的意思是对每一个类别求iou,然后求和除以类别个数。(假设绿色是真实的标签,蓝色是预测的标签,nii就是重合的部分,即预测正确的部分,ti是绿色部分的面积,求和hji指的是蓝色的面积)
上图举例。
然后针对0标签,右图的第一行是针对0的,比如说第一行第四列的意思是真实标签为0但预测为3的个数。
同理,第二行第1列指的是真实标签为0,预测为1的概率。
同理,最后得到这些。
globe acc的计算公式。(对角线上的数字之和,是预测正确的个数)
分母是对应类别真实的像素总个数,即一列的和。
mean iou的计算,分子是预测正确的像素总个数,分母是真实加上预测减去预测正确。
转置卷积(基本上起到了上采样的作用),输入是2x2,输出是4x4,变大了,所以是上采样。
黄框里的是运算之后的宽高。
转置卷积的原理
使用卷积等效矩阵。这样只需要对应元素相乘再相加即可。
输入展平,卷积展平,相乘之后就是输出展平了。
前面那个是IxC=O,这回想要利用O和C求一个和I相同形状的矩阵,只需要用O乘以C的转置矩阵就行了。这样这个P的形状和I是一样的了。
fcn
全卷积的意思是不包括全连接层了。
vgg16的结构,待会会用到maxpooling4的输出和maxpooling3的输出。
上面是用了全连接层,下面用卷积层代替,而参数的数量是一样的。
32s的意思是最后上采样了32倍。
经过backbone后,下采样了32倍,fc6和fc7是原vgg的全连接层,这里用两个卷积层替代,倒数第二个卷积层的卷积核个数是分类类别的个数加一,即加了背景。最后一个是一个转置卷积,上采样32倍,恢复到原图的大小,最后一个卷积使用了双线性插值来初始化转置卷积的参数。最后对像素进行softmax就能得到类别分数了。
16s的结构,右上角的那个转置卷积只上采样的2倍,之后利用maxpooling4的结果,得到原始图像下采样16倍的特征图,正好加在一起,最后再经过一个转置卷积上采样16倍。
不同之处在于还使用了maxpooling3的输出。最后一步上采样8倍。这里的相加是对应元素相加。
损失计算
左图是输出之后的特征图,可以看到类别个数是3。针对channel方向对像素进行softmax处理,就能得到每个位置像素的类别得分。最后和真实值进行交叉熵损失,然后求平均值即可。
语义分割介绍和FCN相关推荐
- 干货 | 一文概览主要语义分割网络,FCN、UNet、SegNet、DeepLab 等等等等应有尽有
翻译不易,麻烦 Ctrl-C Ctrl-V 之后标注转载并加上原译者!! 部分内容翻译,部分内容原创. 内容较多,可以传送门直达.新网络待更- 文章目录 介绍 网络架构 Fully Convoluti ...
- 史上最全语义分割综述(FCN,UNet,SegNet,Deeplab,ASPP...)
目录 语义分割综述 摘要 语义分割领域研究现状 灰度分割 条件随机场 深度学习方法 数据集与评价指标 常用数据集 评价指标 模型介绍 语义分割综述 摘要 语义分割(全像素语义分割)作为经典的计算机视觉 ...
- 一文概览主要语义分割网络:FCN,SegNet,U-Net...
本文来自 CSDN 网站,译者蓝三金 图像的语义分割是将输入图像中的每个像素分配一个语义类别,以得到像素化的密集分类.虽然自 2007 年以来,语义分割/场景解析一直是计算机视觉社区的一部分,但与计算 ...
- 图像语义分割入门:FCN/U-Net网络解析
向AI转型的程序员都关注了这个号???????????? 机器学习AI算法工程 公众号:datayx 图像语义分割(Semantic Segmentation)是图像处理和是机器视觉技术中关于图像 ...
- 【语义分割】一文概览主要语义分割网络,FCN、UNet、SegNet、DeepLab
目录 前言知识 一.语义分割与实例分割的区别 1. Semantic Segmentation(语义分割): 2. Instance Segmentation(实例分割): 二.语义分割一般网络架构 ...
- 语义分割数据集VOC2012 FCN网络结构详解
1 什么是语义分割? 用一句话来说,语义分割的任务是使图像的每一个像素点回归到某一个标签上,而更为高级的有实例分割,实例分割除了将像素点的类别找出,还需要将像素点定位出不同实例. 2 FCN网络结构 ...
- 【CV语义分割】全卷积神经网络FCN(更新ing)
学习总结 (1)paper<Fully Convolutional Networks for Semantic Segmentation> (2)论文翻译可以参考:https://www. ...
- FCN(Fully Convolutional Network)与Unet:谈到语义分割不得不提的两个网络
转载请注明出处:https://blog.csdn.net/wyzjack47/article/details/81107980 语义分割经典之作:FCN(Fully Convolutional Ne ...
- Udacity机器人软件工程师课程笔记(三十) - 语义分割与实例实现 - 使用keras实现语义分割
语义分割 1.语义分割介绍 计算机视觉与机器学习研究者对图像语义分割问题越来越感兴趣.越来越多的应用场景需要精确且高效的分割技术,如自动驾驶.室内导航.甚至虚拟现实与增强现实等.这个需求与视觉相关的各 ...
最新文章
- web前端,我的新开始
- 让Redis在你的系统中发挥更大作用
- Android App压力测试(Monkey和ADB)
- 【数字信号处理】基本序列傅里叶变换总结 ( 单位脉冲序列 δ(n) | {1} 序列 | e^jωn 序列 | cosωn 序列 | sinωn 序列 | a^nu(n) | 矩形窗函数 ) ★★★
- HarmonyOS之将SVG文件转换为XML文件
- java 链表实现堆栈_《Java数据结构与算法》笔记-CH5-链表-4用链表实现堆栈
- java获取用户地理位置_java web 通过ip获取当前地理位置
- php 计算指定年份的周总数与及第几周的开始日期和结束日期(从周一开始)
- 图像处理 --- 一、认识图像处理
- 最小值c语言 循环,C语言循环结构
-C语言求全班同学身高的最大值和最小值
- lpv4的地址格式由多少个字节组成_我们为什么有这么多字符编码格式?
- 测试驱动的面向对象软件开发(china-pub首发)
- (C语言)最长公共子串
- 初创IT公司里开发者最容易犯的九种错误
- 计算机电缆静电,ZR-DJFPVP计算机电缆
- 改版更新后的领英职场不能搜索开发客户怎么办?两种方法加一个工具解决
- html怎么防止扒站点,扒站工具-扒取站点js css的工具
- ThinkPHP5零食商城系统(前后台)
- 【论文查重】常用论文写作查重润色网站
- 邮编查询经纬度_行政区划省市区邮编区号拼音经纬度全面标准数据库 每月更新...