边缘和一些其他区域忽略了。

数据集是ms coco,这些坐标是两两一组,多边形的节点x坐标和y坐标两两一组。之后再把这个多边形区域转换成右下角的这种形式。


pixel acc的分子是预测正确的像素点个数,分母是这个图片总的像素点个数。
mean acc意思是把每个类别的acc计算出来求和,然后除以类别个数。
mean iou的意思是对每一个类别求iou,然后求和除以类别个数。(假设绿色是真实的标签,蓝色是预测的标签,nii就是重合的部分,即预测正确的部分,ti是绿色部分的面积,求和hji指的是蓝色的面积)

上图举例。

然后针对0标签,右图的第一行是针对0的,比如说第一行第四列的意思是真实标签为0但预测为3的个数。

同理,第二行第1列指的是真实标签为0,预测为1的概率。

同理,最后得到这些。

globe acc的计算公式。(对角线上的数字之和,是预测正确的个数)

分母是对应类别真实的像素总个数,即一列的和。

mean iou的计算,分子是预测正确的像素总个数,分母是真实加上预测减去预测正确。

转置卷积(基本上起到了上采样的作用),输入是2x2,输出是4x4,变大了,所以是上采样。

黄框里的是运算之后的宽高。

转置卷积的原理


使用卷积等效矩阵。这样只需要对应元素相乘再相加即可。

输入展平,卷积展平,相乘之后就是输出展平了。

前面那个是IxC=O,这回想要利用O和C求一个和I相同形状的矩阵,只需要用O乘以C的转置矩阵就行了。这样这个P的形状和I是一样的了。

fcn


全卷积的意思是不包括全连接层了。

vgg16的结构,待会会用到maxpooling4的输出和maxpooling3的输出。

上面是用了全连接层,下面用卷积层代替,而参数的数量是一样的。

32s的意思是最后上采样了32倍。

经过backbone后,下采样了32倍,fc6和fc7是原vgg的全连接层,这里用两个卷积层替代,倒数第二个卷积层的卷积核个数是分类类别的个数加一,即加了背景。最后一个是一个转置卷积,上采样32倍,恢复到原图的大小,最后一个卷积使用了双线性插值来初始化转置卷积的参数。最后对像素进行softmax就能得到类别分数了。

16s的结构,右上角的那个转置卷积只上采样的2倍,之后利用maxpooling4的结果,得到原始图像下采样16倍的特征图,正好加在一起,最后再经过一个转置卷积上采样16倍。

不同之处在于还使用了maxpooling3的输出。最后一步上采样8倍。这里的相加是对应元素相加。

损失计算


左图是输出之后的特征图,可以看到类别个数是3。针对channel方向对像素进行softmax处理,就能得到每个位置像素的类别得分。最后和真实值进行交叉熵损失,然后求平均值即可。

语义分割介绍和FCN相关推荐

  1. 干货 | 一文概览主要语义分割网络,FCN、UNet、SegNet、DeepLab 等等等等应有尽有

    翻译不易,麻烦 Ctrl-C Ctrl-V 之后标注转载并加上原译者!! 部分内容翻译,部分内容原创. 内容较多,可以传送门直达.新网络待更- 文章目录 介绍 网络架构 Fully Convoluti ...

  2. 史上最全语义分割综述(FCN,UNet,SegNet,Deeplab,ASPP...)

    目录 语义分割综述 摘要 语义分割领域研究现状 灰度分割 条件随机场 深度学习方法 数据集与评价指标 常用数据集 评价指标 模型介绍 语义分割综述 摘要 语义分割(全像素语义分割)作为经典的计算机视觉 ...

  3. 一文概览主要语义分割网络:FCN,SegNet,U-Net...

    本文来自 CSDN 网站,译者蓝三金 图像的语义分割是将输入图像中的每个像素分配一个语义类别,以得到像素化的密集分类.虽然自 2007 年以来,语义分割/场景解析一直是计算机视觉社区的一部分,但与计算 ...

  4. 图像语义分割入门:FCN/U-Net网络解析

    向AI转型的程序员都关注了这个号???????????? 机器学习AI算法工程   公众号:datayx 图像语义分割(Semantic Segmentation)是图像处理和是机器视觉技术中关于图像 ...

  5. 【语义分割】一文概览主要语义分割网络,FCN、UNet、SegNet、DeepLab

    目录 前言知识 一.语义分割与实例分割的区别 1. Semantic Segmentation(语义分割): 2. Instance Segmentation(实例分割): 二.语义分割一般网络架构 ...

  6. 语义分割数据集VOC2012 FCN网络结构详解

    1 什么是语义分割? 用一句话来说,语义分割的任务是使图像的每一个像素点回归到某一个标签上,而更为高级的有实例分割,实例分割除了将像素点的类别找出,还需要将像素点定位出不同实例. 2 FCN网络结构 ...

  7. 【CV语义分割】全卷积神经网络FCN(更新ing)

    学习总结 (1)paper<Fully Convolutional Networks for Semantic Segmentation> (2)论文翻译可以参考:https://www. ...

  8. FCN(Fully Convolutional Network)与Unet:谈到语义分割不得不提的两个网络

    转载请注明出处:https://blog.csdn.net/wyzjack47/article/details/81107980 语义分割经典之作:FCN(Fully Convolutional Ne ...

  9. Udacity机器人软件工程师课程笔记(三十) - 语义分割与实例实现 - 使用keras实现语义分割

    语义分割 1.语义分割介绍 计算机视觉与机器学习研究者对图像语义分割问题越来越感兴趣.越来越多的应用场景需要精确且高效的分割技术,如自动驾驶.室内导航.甚至虚拟现实与增强现实等.这个需求与视觉相关的各 ...

最新文章

  1. web前端,我的新开始
  2. 让Redis在你的系统中发挥更大作用
  3. Android App压力测试(Monkey和ADB)
  4. 【数字信号处理】基本序列傅里叶变换总结 ( 单位脉冲序列 δ(n) | {1} 序列 | e^jωn 序列 | cosωn 序列 | sinωn 序列 | a^nu(n) | 矩形窗函数 ) ★★★
  5. HarmonyOS之将SVG文件转换为XML文件
  6. java 链表实现堆栈_《Java数据结构与算法》笔记-CH5-链表-4用链表实现堆栈
  7. java获取用户地理位置_java web 通过ip获取当前地理位置
  8. php 计算指定年份的周总数与及第几周的开始日期和结束日期(从周一开始)
  9. 图像处理 --- 一、认识图像处理
  10. 最小值c语言 循环,C语言循环结构 -C语言求全班同学身高的最大值和最小值
  11. lpv4的地址格式由多少个字节组成_我们为什么有这么多字符编码格式?
  12. 测试驱动的面向对象软件开发(china-pub首发)
  13. (C语言)最长公共子串
  14. 初创IT公司里开发者最容易犯的九种错误
  15. 计算机电缆静电,ZR-DJFPVP计算机电缆
  16. 改版更新后的领英职场不能搜索开发客户怎么办?两种方法加一个工具解决
  17. html怎么防止扒站点,扒站工具-扒取站点js css的工具
  18. ThinkPHP5零食商城系统(前后台)
  19. 【论文查重】常用论文写作查重润色网站
  20. 邮编查询经纬度_行政区划省市区邮编区号拼音经纬度全面标准数据库 每月更新...

热门文章

  1. 从注册表中删除打印机列表中的打印机
  2. 教你如何申请个人域名
  3. excel文字显示图标集_创建自己的Excel图标集
  4. Personal Information
  5. 看狄仁杰如何让武则天戒色的
  6. c++ 小游戏 NO6 跑酷游戏
  7. Python批量读取txt文件
  8. 致这一段无悔的大学青春
  9. 高速信号线PCB走线中的阻抗匹配
  10. 【OpenCV入门教程】图像加噪