Deliberated Domain Bridging for Domain Adaptive Semantic Segmentation

Abstract

  许多UDA的工作就是尝试通过各种中间空间来逐步缓解域差异的现象,称为域桥接(DB)。在这篇工作中,我们求助于数据混合来建立了一个deliberated domain bridging(DDB)。DDB的核心包含两个步骤,一个步骤是双路径的域桥接(dual-path domain bridging)来生成两个中间域,使用了一个粗粒度和细粒度数据混合的技术。另一个步骤是交叉路径知识蒸馏,以两个通过中间样本进行训练的互补模型作为"教师",以多"教师"知识蒸馏的方式培养出一个优秀的"学生"模型。这两个步骤以一种交替的方式工作,相互强化,产生具有较强适应能力的DDB。

Introduction

  在这篇文章中,我们同时在输入空间和标签空间中构建中间表示,通过基于混合的数据增强技术。首先,我们将数据混合的方法分为两类:全局混合和局部替换。全局混合的方式可能会造成像素级模糊的问题(比如行人和车重叠在一起),基于局部替换的混合方法可以更好的保护分割主体的语义完整性。其次,为了能够充分利用局部替换的数据混合方法,我们进一步从两个补充的角度来更深度的探索它。通过粗的区域级的混合(CutMix)和细粒度的类级混合(ClassMix)。粗的区域级混合域桥接帮助模型去利用上下文信息来减少语义的混淆(比如大巴火车这间的难以区分)。互补的,细粒度的类级混合域桥接可以帮助模型去充分的探索每个类别的特性,使得每个主体是可区分的。但是,这两个方法趋向于使模型过多的依赖于上下文信息或者类别固有的特征,在目标域上分别导致了类的偏差和混淆。
  在这篇文章中,作者提出了DDB来小心地利用数据混合技术将源域上的知识逐步转移到目标域上。作为一个优化策略,DDB包含了两个交替的步骤,Dual-Path Domain Bridging (DPDB)和Cross-path Knowledge (CKD)。第一步,利用粗的区域级混合技术和细粒度的类级混合技术来构建两个互补的桥接路径用来训练两个教师模型,取得了双粒度的域桥接。第二步,CKD使用两个互补的教师模型在目标域上指导一个理想的学生模型来实现适应性分割。这两个优化的步骤交替进行,学生模型和教师模型共同进步。

Deliberated Domain Bridging for DASS

Revisting Existing DB Methods.

global interpolation mix:
xnewx_{new}xnew​ = λ·xsx_sxs​ + (1-λ)·xtx_txt​
ynewy_{new}ynew​ = λ·ysy_sys​ + (1-λ)·yty_tyt​
就是通过一个比率将源域样本和目标域样本的标签和图像混合在一起。
local replacement mix
xnewx_{new}xnew​ = M⊙xsx_sxs​ + (1-M)⊙xtx_txt​
ynewy_{new}ynew​ = M⊙ysy_sys​ + (1-M)⊙yty_tyt​
通过掩码来实现局部替换

Analyzing DB Methods with Toy Game.

通过实验表明,粗/细粒度的域桥接方法可能相互促进也可能相互制约。

Analyzing the Local Replacement Based DB Methods with Visualization.

经过数据的可视化,我们发现粗/细粒度的域桥接方法都有各自的优缺点,现在最重要的是找到一个互补的方法来结合它们获得一种双赢的效果。

Progressively learning from Dual-grained Domain Bridging

Dual-Path Domain Bridging (DPDB).

  首先,利用CutMix和ClassMix技术来构建coarse region-path(CRP)和fine class-path(FCP)。
然后,最小化像素级交叉熵(CE)损失来减轻域差异(使用源域数据训练模型)

这里的MCM_CMC​指的是在CRP上训练的模型。
我们通过EMA的方式生成了一个教师网络,用于生成去噪的像素级伪标签。
作者通过coarse region-path的方法生成了桥接图片xcrpx_{crp}xcrp​和标签ycrpy_{crp}ycrp​
生成了一个基于置信度的权重映射在训练过程中规范化目标域样本:

在region-path bridging上最小化交叉熵损失:

在CRP上总的损失函数:
同样的,作者在FCP上做了相同的工作,损失函数记为LFL_FLF​,下一个问题就是如何合适的整合这两种互补的知识。

Cross-path Knowledge Distillation(CKD).

  受之前工作的启发,可以在输出空间中使用知识蒸馏将知识从教师网络转移到学生网络。在这里,我们对其进行了改革,从两个互补的教师中提取知识,并自适应地将整合后的知识转移给一个学生。请注意,这里只是在未标记的目标域中整合和转移互补的知识。
  具体来说,就是对两名教师的输出进行了自适应加权和整合,作为指导,以驱动学生模型在未标记的目标领域中学习分割。此外,我们实验选择了“硬”蒸馏,即集成预测的softmax对数来生成一个独热向量,并利用CE损失监督学生模型MS。详细的蒸馏损失可以写成:

xaugt表示经过颜色抖动,高斯模糊增强的目标域样本,y-t由教师网络的softmax 对数加权集成获得。
  直观地说,不同的样本,甚至一个样本中的不同像素,都需要两个教师模型的不同贡献来进行集成。通过计算分类层前的特征响应f(i)与每个类别的质心η(j)之间的距离,我们自适应地在目标域内生成一个像素级的权重图w(i,j)。在每个位置上,特征响应离某一类别的一个质心越近,就越有可能属于该类别,因此对集成效应的贡献就越大。这里以CRP举例,我们先求目标域上的类别质心:

计算距离,生成权重图:

同样的,我们也在FCP上计算出了对应的权重图w(i,j)F,组合这两个权重图我们就得到了y-

Ο()代表的是softmax函数。此外,学生模型也要源域数据的监督来生成区别性的特征:

学生模型总的损失函数可以表示为:

Alternation Optimization Strategy.

  通过整合来自两个专家教师模型的互补知识,我们可以得到一个更好的学生模型。反过来,这个学生模型可以在下一轮一轮中初始化教师模型,从而产生两个更强的教师模型。他们互相宣传,取得了双赢的效果。最终,我们可以在最后一轮结束后获得最强大的学生模式。

总结:

就是通过两种不同的数据增强方法来训练两个教师模型,并通过知识蒸馏来生成一个最终的学生模型

Deliberated Domain Bridging for Domain Adaptive Semantic Segmentation相关推荐

  1. SePiCo: Semantic-Guided Pixel Contrast for Domain Adaptive Semantic Segmentation

    SePiCo: Semantic-Guided Pixel Contrast for Domain Adaptive Semantic Segmentation Abstract   之前的许多方法尝 ...

  2. CVPR2022自适应/语义分割:Class-Balanced Pixel-Level Self-Labeling for Domain Adaptive Semantic Segmentation

    CVPR2022自适应/语义分割:Class-Balanced Pixel-Level Self-Labeling for Domain Adaptive Semantic Segmentation用 ...

  3. 语义分割-Unsupervised Domain Adaptation in Semantic Segmentation:a Review语义分割中的无监督领域自适应:综述

    Unsupervised Domain Adaptation in Semantic Segmentation:a Review语义分割中的无监督领域自适应:综述 0.摘要 1.介绍 1.1.语义分割 ...

  4. AAAI 2022主题论文推荐——Semantic Segmentation

    AAAI是具有重要影响力的国际学术组织,由计算机科学和人工智能领域奠基人Allen Newell.Marvin Minsky.John McCarthy等学者于1979年共同创立,旨在推动智能思维与行 ...

  5. 论文笔记-Domain Adaptation for Semantic Segmentation with Maximum Squares Loss

    论文信息 论文标题:Domain Adaptation for Semantic Segmentation with Maximum Squares Loss 论文作者:Minghao Chen, H ...

  6. Learning from Synthetic Data: Addressing Domain Shift for Semantic Segmentation

    文章目录 1 Author 2 Abstract 3 Introduction 4 Method 4.1 Description of network blocks 4.2 Treatment of ...

  7. [论文速览]:Multi-source Domain Adaptation for Semantic Segmentation

    Multi-source Domain Adaptation for Semantic Segmentation [NeurIPS 2019] [2020: MADAN: Multi-source A ...

  8. 论文笔记-SSF-DAN: Separated Semantic Feature based Domain Adaptation Network for Semantic Segmentation

    论文信息 论文标题:SSF-DAN: Separated Semantic Feature based Domain Adaptation Network for Semantic Segmentat ...

  9. Adversarial Semantic Hallucination for Domain Generalized Semantic Segmentation

    摘要 当测试数据和训练数据来自不同的领域时,卷积神经网络可能表现不佳.虽然可以通过使用目标域数据对齐源和目标域特征表示来缓解这个问题,但由于隐私问题,目标域数据可能不可用.因此,需要在训练期间不访问目 ...

最新文章

  1. 通过Navicat for MySQL远程连接的时候报错mysql 1130的解决方法
  2. VC6中用DOM遍历网页中的元素
  3. 《Oracle大型数据库在AIX UNIX上的实战详解》的集中答疑九 数据库字符集与国家语言...
  4. 修改JAVA代码,需要重启Tomcat的原因
  5. ASP.NET 3.5中的ListView控件和DataPager控件(一)
  6. WEB-INF 目录下的文件无法直接浏览器访问
  7. 安装QQ、TIM提示:安装包可能被非法改动导致安装失败,请从官网下载最新安装包重新安装
  8. [SPOJ CIRU]The area of the union of circles(自适应Simpson积分求圆并面积)
  9. 消息中间件RabbitMQ(五)——实现RPC调用
  10. IExplore.exe应用程序错误解决方法
  11. 大专计算机考试题,大专计算机考试试题.doc
  12. 狐狸找兔子问题 C语言
  13. Mysql数据库简单回滚操作
  14. 服务器虚拟资源池,大型医院基于Hyper-V的虚拟化服务器资源池构建
  15. allegro 问题
  16. MFC - LNK2001 “无法解析的外部符号”的几种情况及解决办法
  17. SpringBoot的controller为什么不能并行执行?同一个浏览器连续多次访问同一个url竟然是串行的?- 第329篇
  18. 小人的生存之道:灵敏的耳朵和甜蜜的嘴巴。
  19. 你和乘风破浪姐姐只差个智能视频SDK
  20. ESP32从零开始(2)—— VScode 安装 Espressif IDF(安装ESP32)

热门文章

  1. 【Arduino】关于使用USB-ISP烧入bootloader的一些记录
  2. ubuntu 出现WIFi设备未就绪的解决办法
  3. OrangePi PC 玩Linux主线内核踩坑之旅(二)之制作镜像后的查遗补缺
  4. 爱加密:终止手游之殇,全面解决手游安全问题
  5. 街舞中的rolling机器人_这,就是街舞中的那些“Swag”十足的舞蹈类型,你了解吗?...
  6. 笔记本计算机待机后显示器,笔记本电脑休眠后一直黑屏怎么回事_笔记本休眠后屏幕一直黑屏无法唤醒如何解决-win7之家...
  7. PHP中的符号 -、= 和 :: 详解
  8. Phyllotaxis算法应用
  9. android 卡联系人导入iphone,苹果手机怎么把通讯录导入新手机sim卡
  10. 《鱿鱼游戏》我怕了,还是整点阳间的游戏吧,Python版“碰糖”来袭—你能过几关?