点上方蓝字计算机视觉联盟获取更多干货

在右上方 ··· 设为星标 ★,与你不见不散

仅作学术分享,不代表本公众号立场,侵权联系删除

转载于:作者丨罗亚威@知乎(已授权)

来源丨https://zhuanlan.zhihu.com/p/337094706

AI博士笔记系列推荐

周志华《机器学习》手推笔记正式开源!可打印版本附pdf下载链接

引言

传统的无监督领域自适应方法(UDA)除了需要大量的源域数据(Source Data)外,还需要足够数量的无标注目标域样本(Target Data)进行训练,比如基于分布对齐、基于伪标签提取和基于熵最小化的方法等均隶属于此范畴。然而在实际场景中,除了数据标注费时费力,数据的采集本身也可能存在困难,比如因数据隐私保护、采集环境苛刻等造成的目标域数据稀缺。因此,即使能够通过计算机生成无限量的虚拟数据,因为真实数据的稀缺,网络也无法通过传统的UDA方法进行正常训练。针对这种目标数据稀缺的现实而具有挑战性的问题,本文提出了一种新的解决方法。文章假设我们只搜集到了一张来自于目标域的珍贵样本,仅仅通过对该样本的充分挖掘,使模型能够感知到潜在的目标域分布,达到“一叶落知天下秋”的效果。原论文发表于NeurIPS2020,标题为 《Adversarial Style Mining for One-Shot Unsupervised Domain Adaptation》,代码已开源。论文第一作者罗亚威,博士毕业于华中科技大学计算机科学与技术学院,现任浙江大学计算机科学与技术学院博士后。

Paper:Adversarial Style Mining for One-shot Unsupervised Domain Adaptation

Code: Please feel free to contact me at yaweiluo329[at]gmail[dot]com

问题背景

图1(a) 传统的领域自适应方法在源域/目标域数据充足的情况下能达到好的效果,但在目标域数据稀缺(如只有单个样本)的情况下效果不佳。

Unsupervised Domain Adaptation (UDA)

深度学习方法在计算机视觉的多个任务中都取得了令人满意的成果。然而,训练一个良好的神经网络往往需要海量的人工标注数据。当前一个比较流行的思路是借助虚拟的合成数据进行模型训练,比如利用3D游戏截图等等。然而,由虚拟数据训练出的网络在真实数据上往往泛化能力不佳,而造成这一问题的主要原因被称为域偏差(Domain Shift)。为了解决这一问题,研究者利用无监督领域自适应方法来缓解虚拟源域数据和真实目标域数据分布的差距,达到了比较好的效果,如图1(a)左所示。

One-Shot Unsupervised Domain Adaptation (OSUDA)

传统的无监督领域自适应方法除了需要大量的源域数据外,还需要足够数量的无标注目标域样本进行训练,比如基于分布对齐、基于伪标签提取和基于熵最小化的方法等均隶属于此范畴。然而在实际场景中,除了数据标注费时费力,数据的采集本身也可能存在困难,比如因数据隐私保护、采集环境苛刻等造成的目标域数据稀缺。因此,即使能够通过计算机生成无限量的虚拟数据,因为真实数据的稀缺,网络也无法通过传统的UDA方法进行正常训练,如图1(a)右所示。

针对这种目标数据稀缺的现实问题,本文提出了一种新的解决方法。文章假设我们只搜集到了一张来自于目标域的珍贵样本,仅仅通过对该样本的充分挖掘,使模型能够感知到潜在的目标域分布,达到“一叶落知天下秋”的效果。

解决思路

图1(b) ASM由风格生成网络G和任务网络M组成。G通过采样,将one-shot目标域样本xt附近的风格赋予源域图片集合{Xs},并在根据M的反馈在每次迭代中生成更多更难的潜在目标域风格,而M则需要正确处理新生成的图片,并将训练损失反馈给G。显然,两者形成了一个对抗的过程。

Domain Adaptive Semantic Segmentation问题假设源域和目标域具有相似的语义内容,但图片风格不同。传统基于风格迁移的Domain Adaptation方法将源域图片转化到目标域图片的风格分布上进行训练,以此降低domain gap。然而,在只有一张目标域图片的情况下,如果直接按照风格迁移的思路,所有的源域图片均会迁移到同一个单调的风格上,造成过拟合。因此,这里我们将OSUDA的问题转化为了风格搜索问题,即如何从一个“孤点”风格搜索出更多潜在的目标域风格,形成“风格分布”,从而让领域自适应变得可行。

到目前为止,One-shot setting下最大的难题还是没有得到解决。因为只有一张图片,潜在的目标域风格分布是完全未知的。那么如何有效地搜索呢?我们的思路是这样的。一方面,我们认为,潜在的目标域风格虽然不可见,但大概分布在该one-shot风格的附近。另一方面,我们应该让搜索出的风格对模型的泛化能力有价值,即不能完全过拟合到one-shot的风格。沿着这种思路,我们设计了ASM方法。

ASM方法以one-shot图片提供的风格作为“锚”风格(anchored style),利用一个图片生成网络G在anchored style周围采样一个相似的风格(该风格离anchored style较近)进行图片生成,然后将下一步的搜索方向确定为对当前任务模型M最难的方向(利用梯度上升实现)进行搜索,从而生成更多更难风格的图像来提高任务特定模型 M 的泛化能力。另一方面,更新后的 M 为 G 提供动态反馈,以指导G下一步的搜索方向。显然,M与G形成了一个对抗的过程。在这种对抗训练过程中,G逐步生成对于M来说更加困难的图片,而M不断地更新G的搜索方向。训练收敛后,M可以对anchored style周围的所有风格具有较强的泛化能力。

方法详情

风格生成网络RAIN

根据解决思路中的描述,针对OSUDA问题,ASM算法需要一个根据M的训练loss而动态改变迁移风格的模块G,且模块G需要具有采样能力和端到端可导的搜索能力。基于AdaIN方法,我们设计了RAIN模块。RAIN 在原始 AdaIN 的特征空间中额外装备了一个变分自编码器(称为 style VAE)。style VAE将所有的风格分布都编码到了一个正态分布中,因此RAIN在训练完成后,不需要再像AdaIN一样每次输入风格图片进行风格迁移,而是可以直接通过采样进行随机风格迁移。通过改变采样向量,生成的风格也相应的发生变化。因此,直接将梯度反传至采样向量即可完成端到端的对抗训练。RAIN module的详情如图2所示。

对抗风格挖掘网络ASM

有了可采样可求导的风格生成模块G,ASM的实现也就水到渠成了。文章将预训练的G(也就是RAIN)的参数固定(可变的只有采样向量),与M组成一个对抗网络。这里的M以语义分割常用的FCN网络为例,整体框架如图3所示。

ASM的训练目标是优化两个损失函数。

任务损失: 利用任务损失指导 M 从(已经过风格化的)源域数据和标签中学习知识。

一致性损失: 为了进一步鼓励 M 提取领域不变性特征,算法使用了一致性损失,定义如下。

其中  代表 M 中的深层特征,  代表一个 Batch 内所有图像的深层特征向量平均值。该损失函数的设计动机是因为领域自适应问题假设源域和目标域共享相同的内容空间,但是风格不同,因此不同风格化下的源图像应该在深层保持相似的语义信息。这种损失限制了具有相同内容但不同风格的批图像之间的语义一致性,鼓励了 M 仅仅提取语义信息这种领域间不变的特征,增强了模型的泛化能力。

综上所述, ASM 模型的总体优化目标为:

算法伪代码:

实验结果

本文分别在Classification和Segmentation的OSUDA任务上进行了实验。

OSUDA Classification实验

Classification实验采用了经典的MNIST-USPS-SVHN互相迁移的任务进行效果度量,结果如表1所示。

我们通过T-SNE图进一步展示ASM的效果,如图4所示。

图4 tSNE 特征可视化(a):Source only;(b):CycleGAN;(c):OST;(D):ASM

OSUDA Segmentation实验

OSUDA Segmentation实验在GTA2Cityscapes和Synthia2Cityscapes两个任务上进行测试,结果如表2所示。可以看到,在OSUDA setting下ASM获得了SOTA的mIOU,并且在传统的UDA setting下,ASM也能达到很好的效果。

图5展示了OSUDA语义分割任务的可视化结果。

图5 OSUDA语义分割可视化结果

消融实验

消融实验探究了consistency loss的重要性,如表3所示。

不同采样策略的结果比较

该实验比较了不同采样类型的风格生成结果,如表4所示。Anchor Sampling是完全在one-shot样本附近的采样策略(无对抗搜索过程),容易造成过拟合;而Random Sampling会生成对M无益的随机风格。ASM方法生成的样本既保证了风格符合潜在的目标域风格分布,又保证了对任务模型的有效泛化能力。

不同采样策略生成结果可视化,如图6所示。

图6 不同采样策略的风格迁移结果

结论

针对目标域数据可能稀缺的情况,本章提出了新的基于单目标域样本的领域自适应(One-shot Unsupervised Domain Adaptation,简称 OSUDA)问题场景,并针对此问题设计了对抗风格挖掘(Adversarial Style Mining,简称 ASM)算法。OSUDA 问题的困难之处在于,由于无法从单个目标域样本推理目标域的真实分布,因此基于特征对齐、基于伪标签生成和基于熵最小化的一些常见 UDA 方法都无法正常使用。本文所提出的 ASM 以对抗学习的方式将风格转换模块和特定任务模块相结合,迭代地、高效地搜索新的风格化样本,以帮助任务模型泛化到几乎不可见的目标域。ASM 可以被视为一种通用框架,因为特定于任务的子网络 M 可以根据不同的跨域任务进行更改。本章在分类和分割任务上的实验结果表明了 ASM 针对 OSUDA 问题有效性。与其他领域自适应方法相比,ASM 在目标域样本稀缺的情境下具有最优的性能。

OSUDA是一种非常现实却极具挑战性的问题环境,目前相关研究较少,特别是在语义分割任务上还有较大提升空间。

end

这是我的私人微信,还有少量坑位,可与相关学者研究人员交流学习 

目前开设有人工智能、机器学习、计算机视觉、自动驾驶(含SLAM)、Python、求职面经、综合交流群扫描添加CV联盟微信拉你进群,备注:CV联盟

王博的公众号,欢迎关注,干货多多

王博的系列手推笔记(附高清PDF下载):

博士笔记 | 周志华《机器学习》手推笔记第一章思维导图

博士笔记 | 周志华《机器学习》手推笔记第二章“模型评估与选择”

博士笔记 | 周志华《机器学习》手推笔记第三章“线性模型”

博士笔记 | 周志华《机器学习》手推笔记第四章“决策树”

博士笔记 | 周志华《机器学习》手推笔记第五章“神经网络”

博士笔记 | 周志华《机器学习》手推笔记第六章支持向量机(上)

博士笔记 | 周志华《机器学习》手推笔记第六章支持向量机(下)

博士笔记 | 周志华《机器学习》手推笔记第七章贝叶斯分类(上)

博士笔记 | 周志华《机器学习》手推笔记第七章贝叶斯分类(下)

博士笔记 | 周志华《机器学习》手推笔记第八章(上)

博士笔记 | 周志华《机器学习》手推笔记第八章(下)

博士笔记 | 周志华《机器学习》手推笔记第九章

点个在看支持一下吧

一叶知秋:基于“单目标域样本”的领域自适应方法相关推荐

  1. [ NeurIPS 2020 ] 一叶知秋 —— 基于“单目标域样本”的领域自适应方法

    [ NeurIPS 2020 ] 一叶知秋 -- 基于"单目标域样本"的领域自适应方法 引言 华中科技大学.浙江大学.百度研究院新作--基于"单目标域样本"的无 ...

  2. yzmcms图片自适应代码_[ NeurIPS 2020 ] 一叶知秋 —— 基于“单目标域样本”的领域自适应方法...

    引言 传统的无监督领域自适应方法(UDA)除了需要大量的源域数据(Source Data)外,还需要足够数量的无标注目标域样本(Target Data)进行训练,比如基于分布对齐.基于伪标签提取和基于 ...

  3. NeurIPS 2020 | 基于“单目标域样本”的领域自适应方法

    点上方蓝字计算机视觉联盟获取更多干货 在右上方 ··· 设为星标 ★,与你不见不散 仅作学术分享,不代表本公众号立场,侵权联系删除 转载于:作者丨罗亚威@知乎(已授权) 来源丨https://zhua ...

  4. NIPS 2018论文解读 | 基于条件对抗网络的领域自适应方法

    在碎片化阅读充斥眼球的时代,越来越少的人会去关注每篇论文背后的探索和思考. 在这个栏目里,你会快速 get 每篇精选论文的亮点和痛点,时刻紧跟 AI 前沿成果. 点击本文底部的「阅读原文」即刻加入社区 ...

  5. 【IEEE CIM 2023】基于多目标进化算法的抗菌肽设计方法

    Evolutionary Multi Objective Optimization in Searching for Various Antimicrobial Peptides 小生境共享(Nich ...

  6. Back-Training: 用于问题生成和段落检索的全新领域自适应方法

    ©PaperWeekly 原创 · 作者 | Maple小七 学校 | 北京邮电大学硕士生 研究方向 | 自然语言处理 本文提出了一种新的领域自适应方法:back-training,传统的 self- ...

  7. ICCV 2021 | G-SFDA:无需源数据的领域自适应方法

    ©PaperWeekly 原创 · 作者 | 张一帆 学校 | 中科院自动化所博士生 研究方向 | 计算机视觉 这篇文章介绍一篇 ICCV 2021 的工作:Generalized Source-fr ...

  8. ECCV 2020 | PHOSA:一种基于单目图像的人-物重建方法

    项目.论文地址:在公众号「3D视觉工坊」,后台回复「PHOSA」,即可直接下载. 概述 作者提出了一种能够推断出人类和物体的形状和空间排列的方法,只需要一张在自然环境中捕捉的图像,且不需要任何带有3D ...

  9. ReID:无监督及领域自适应的目标重识别概述

    无监督(unsupervised)及领域自适应(domain adaptive)的目标重识别是目标重识别领域中两个重要的研究方向,同时二者又关系密切.本文中部分配图和内容参考葛艺潇:无监督及领域自适应 ...

最新文章

  1. 一文读懂PID控制算法
  2. linux每日命令(36): wc命令
  3. AB测试:基础概念、应用场景及入门指南
  4. 组合数据类型综合练习
  5. webdriver 执行完毕关闭chromedriver进程
  6. C++11 右值引用、移动语义、完美转发、万能引用
  7. 王彪-20162321《程序设计与数据结构2nd》-第十一周学习总结与实验报告
  8. port security violation protect retrict shutdown 之具体解释
  9. 戴尔服务器哪1顶型号好,戴尔PowerEdge R730xd新一代服务器评测
  10. 关于 exynos 4412 按键中断 异步通知
  11. CHIL-ORACLE-创建视图
  12. TCP建立连接的三次握手过程
  13. DPDK收发包流程分析(一)
  14. 坐飞机还是尽量早点出发(差点误机)
  15. Matlab | matpower5.0:最优潮流执行步骤及修改教程
  16. itest听力答案2020_2020英语一真题和答案
  17. 在内网中使用maven_使用nexus搭建内网maven镜像
  18. Ubuntu18.04之lightdm取代gdm
  19. 量子计算机人类意识云,我们的大脑很可能就是一台高度发达的量子计算机
  20. Java开发必学:java核心技术电子书资源

热门文章

  1. opencv python教程-OpenCV4 Python 最新中文版官方教程来了(附下载)
  2. ios13 无法传参_iOS13个人热点功能频遭投诉
  3. 网页制作表单代码java_网页制作的40个经典代码
  4. java操作mysql临时表_Java开发网 - 系统临时表使用问题
  5. matlab 平滑曲线连接_【仪光学习】技能分享 | 前方高能:如何用Matlab轻松实现数学建模...
  6. 计算机网络英文题库,强烈推荐计算机网络英文试题库(附答案)chapter.doc
  7. arp包多久发一次_多久洗一次头发合适?洗头越频繁,掉的头发越多?
  8. 制作自己的linux内核,打造属于你自己的Linux系统
  9. 如何解决网页中console的显示内容出现undefined和null_如何优雅地处理前端异常?...
  10. 怎么获取服务器接口文档,服务器接口获取数据