[论文地址] [代码] [BMVC 18]

Abstract

我们提出了一种使用对抗性网络进行半监督性语义分割的方法。虽然大多数现有的判别器都是在图像层面上对输入图像进行真假分类的训练,但我们以完全卷积的方式设计了一个判别器,以区分预测的概率图和考虑到空间分辨率的地面真实分割分布。我们表明,通过将对抗性损失与拟议模型的标准交叉熵损失相结合,所提出的判别器可用于提高语义分割的准确性。此外,全卷积判别器通过发现未标记图像的预测结果中值得信赖的区域,从而提供额外的监督信号,实现半监督学习。与现有的利用弱标记图像的方法相比,我们的方法利用未标记的图像来增强分割模型。在PASCAL VOC 2012和Cityscapes数据集上的实验结果证明了所提算法的有效性。

Method

本文采用对抗学习进行了半监督分割任务,最大的特点在于判别器的设计。一般来讲,判别器做的都是一个二分类问题,属于分类网络——输入一张图片,给出一个二值的结果(真/假);而本文的判别器做的是分割问题,属于一种FCN,输出为Confidence Map;整体流程如下所示:

额外值得注意一点的是,本文的半监督不需要对原有的语义分割网络进行任何修改,只是引入了额外的判别器框架,因此理论上可迁移性会比较好(甚至可以移到别的任务上)。

具体来说,判别器接受的输入为两种分割结果——真实的Ground Truth Mask(图中的Label Map)以及网络的预测结果pred,输出为Confidence Map。对于置信度图的每个像素的值,为1表示网络认为该位置的预测结果是对的(真),为0则表示是错的(假)。因此,对于判别器的训练,输入ground truth mask,判别器给出的输出应该是一张全为1的map;输入网络的预测,判别器给出的输出应该是一张全0的map。

单纯从全监督的角度理解,加入这么个mask,其实也可以起到训练分割网络的作用;即,网络的预测结果只要和GT Mask一模一样,那么判别器自然无法区分;不过,单凭判别器并不能约束这个mask和原来的图像就是一一对应的,因此正经的交叉熵分割loss也不能少。

那么为什么加入了判别器就能起到半监督的作用呢?为了弄明白这一点,我们得了解下网络的训练流程。在全监督训练阶段,利用已标注的图像,分割网络得到了基本的训练,而判别器也被训练用于如何区分GT Mask和pred;在半监督训练阶段,判别器参数固定。对于没有标注的样本,判别器相当于起到了一个"虚拟GT的作用"。通过鼓励分割网络对未标注的图像(未标注训练集/测试集)产生判别器无法区分的样本,从而进一步提升网络的分割性能。

图中所涉及到的半监督分割损失如下: L semi  = − ∑ h , w ∑ c ∈ C I ( D ( S ( X n ) ) ( h , w ) > T semi  ) ⋅ Y ^ n ( h , w , c ) log ⁡ ( S ( X n ) ( h , w , c ) ) \mathcal{L}_{\text {semi }}=-\sum_{h, w} \sum_{c \in C} I\left(D\left(S\left(\mathbf{X}_n\right)\right)^{(h, w)}>T_{\text {semi }}\right) \cdot \hat{\mathbf{Y}}_n^{(h, w, c)} \log \left(S\left(\mathbf{X}_n\right)^{(h, w, c)}\right) Lsemi ​=−h,w∑​c∈C∑​I(D(S(Xn​))(h,w)>Tsemi ​)⋅Y^n(h,w,c)​log(S(Xn​)(h,w,c)) 这里的超参 T s e m i T_{semi} Tsemi​的建议值为0.1到0.3,也就是对confidence map的置信度要求没那么高(否则一般是0.5)。

[论文阅读] Adversarial Learning for Semi-Supervised Semantic Segmentation相关推荐

  1. 【论文阅读】Structured Knowledge Distillation for Semantic Segmentation

    概述 这篇论文来自CVPR2019 Oral. 论文的出发点:语义分割的模型往往很难兼顾速度与精度,也因此语义分割的网络分为两类,论文中描述为 cumbersome segmentation netw ...

  2. 【Few-Shot Segmentation论文阅读笔记】PANet: Few-Shot Image Semantic Segmentation with Prototype , ICCV, 2019

    Abstract Target Question: Few-shot Segmentation 本文主要工作: 基于metric-learning的思想,本文提出了PANet(Prototype Al ...

  3. 论文阅读 | Residual Conv-Deconv Grid Network for Semantic Segmentation

    GridNet发表在BMVC2017,用于语义分割,一篇很早期的文章 论文地址:[here] (文章没有给代码地址,但是里面的网络设计讲的很详细,可以自己复现出来,github上也有很多别人复现的代码 ...

  4. 【论文阅读】Fully Convolutional Networks for Semantic Segmentation【CVPR,PAMI】

    摘要 我们的研究表明,卷积网络通过端到端.像素到像素的训练,在语义分割方面比之前的最佳结果有所提高 我们的关键见解是构建完全卷积网络,它接受任意大小的输入,并产生相应大小的输出,并具有有效的推理和学习 ...

  5. [ICCV2019论文阅读]Asymmetric Non-local Neural Networks for Semantic Segmentation

    作者:Zhen Zhu, Mengde Xu, Song Bai, Tengteng Huang, Xiang Bai 机构:Huazhong University of Science and Te ...

  6. 【论文阅读】Online Attention Accumulation for Weakly Supervised Semantic Segmentation

    一篇弱监督分割领域的论文,其会议版本为: (ICCV2019)Integral Object Mining via Online Attention Accumulation 论文标题: Online ...

  7. 【论文阅读】Regional Semantic Contrast and Aggregation for Weakly Supervised Semantic Segmentation

    论文标题: Regional Semantic Contrast and Aggregation for Weakly Supervised Semantic Segmentation 作者信息: 代 ...

  8. 【论文阅读】Weakly Supervised Semantic Segmentation using Out-of-Distribution Data

    一篇弱监督分割领域的论文,发表在CVPR2022上: 论文标题: Weakly Supervised Semantic Segmentation using Out-of-Distribution D ...

  9. 【论文阅读】Cross Language Image Matching for Weakly Supervised Semantic Segmentation

    这篇论文是CLIP模型较早的在弱监督分割上应用的论文. 论文标题: Cross Language Image Matching for Weakly Supervised Semantic Segme ...

最新文章

  1. https协议必须使用443端口吗_http、https、http2、websocket之间的关系
  2. 监控系统 Prometheus 和 Zabbix 对比
  3. gin获取Get + Post 混合
  4. HTML页面引入另一个HTML页面,比如各个页面引入通用的网站头部、尾部、导航栏
  5. Tomcat的下载安装以及在eclipse中的配置
  6. OpenGL基于PBR的图像的光照IBL的实例
  7. mongodb幽灵操作的解决方案
  8. [react] 怎么在React中引入其它的UI库,例如Bootstrap
  9. 数据结构之树的应用:并查集
  10. android防止内存溢出浅析
  11. java $表示什么_java – 变量名中$的含义是什么?
  12. 3.15 晚会—「饿了么」之殇
  13. Hystrix是如何工作的
  14. 用逻辑回归对用户分类 (理论+实战)
  15. 阶段3 2.Spring_02.程序间耦合_6 工厂模式解耦
  16. django 模型-----模型查询
  17. 关于Winform下,获取Treeview中CheckBox选中项的“.NET研究”技巧
  18. ffmpeg 分辨率 压缩_ffmpeg 视频压缩
  19. 忠和资本:2021年后市刘国忠行情预测
  20. udal导mysql_MySQL性能测试工具之mysqlslap

热门文章

  1. Protein Ising Model Problem
  2. 【商迪3D】与您细说什么是VR虚拟电子沙盘3D数字沙盘有什么功能
  3. 大型网站技术架构(一)--大型网站架构演化
  4. 什么是骨传导耳机?骨传导耳机好不好,看完这些你就知道了!
  5. 积极向上的佳句(2)
  6. iOS 开发之动态下载系统提供的多种中文字体
  7. 复旦大学计算机学院课表,复旦大学研究生课程表.PDF
  8. java c 转换_由javac完成的任何类型的转换?
  9. 2020中国超级计算机排名第一,最新top500超级计算机榜单 全球超级计算机榜单2020新一期:中国部署数量世界排名首位...
  10. [Firemonkey]开发Android系统的PDA手机扫码功能