domain adaptation 小综述
前段时间为了一个项目读了一些domain adaptation的论文,希望了解领域背景和前沿,现在进行一个总结。
首先介绍下domain adaptation的概念,简单地说就是,在一个数据集上训练得到的模型无法很好地在另一个数据集上表现,两个数据集之间存在差异。用上术语就是两个domain之间存在domain shift,导致了性能的下降。举个例子,自然图像数据集上训练得到的目标检测模型,应用到遥感图像上表现很差,是因为自然图像和遥感图像之间存在着domain shift。domain adaptation 就是为了寻找各种各样的方法去克服domain shift。
domain adaptation 中有个子领域 unsupervised domain adaptation,这是我读的论文中主要涉及的领域,也是相对来说应用到真实场景中更加自然的一个方向。unsupervised domain adaptation 是指这样一类问题:
你有两个数据集/数据源,我们称其中一个为source domain,另一个为 target domain。关于source domain我们有完善的标注,但它不是我们应用的目标,我们想要应用到 target domain 上,也就是说追求的是 target domain 上有较高的测试指标。但关于target domain我们根本没有标注。举个例子,我们希望在黑暗图像上有较好的目标检测效果,但我们只有很多黑暗图像,却没有关于这些图像的目标检测标注。那么把黑暗图像当作 target domain,我们可以借助有标注的高光图像数据集如coco和voc,把这样的数据集当作 source domain,通过种种方法,利用source domain 的 labeled samples 和 target domain 的 unlabeled samples,想办法克服两个domain之间的domain shift得到一个能够在target domain 上进行预测并且效果较好的方法,就是unsupervised domain adaptation的目标。
domain adaptation 问题除了 unsupervised domain adaptation 外还有 semi-supervised domain adaptation,这种 DA 的t arget domain 有 partial label。除此之外还可以有另一种分类方式,是根据 domain 的数量,有multi-single的domain adaptation和 single-single 的 domain adaptation 等,涉及到multi-domain adaptation的往往在方法的考虑要考虑如何无监督地或有监督地识别出不同的domain分别处理或是统计方法进行建模等,而 single-single domain adaptation 则更加关注于 domain shift 这一核心,接下来也将主要介绍 unsupervised domain adaptation 中的 single-single 方向。
对于 single-source unsupervised domain adaptation,有三个方向:
- 一个是通过数据增强和训练流程的控制等,学得一个对 domain 不敏感的模型;
- 另一个是希望学得一个对不同 domain 不变的特征空间,换句话说,希望将 target domain 和 source domain 映射到这样一个特征空间,在这个空间下 target domain 的特征和 source domain 的特征有相同的分布。这个映射通常就是利用卷积神经网络来完成的;
- 第三个方向则是利用GAN进行domain的transfer,要么是将source domain的图片通过GAN的风格转换变成target domain的图片,然后利用这些转换后的图片以及原有的标签训练一个针对target domain的模型,要么是训练一个将target domain到source domain的风格迁移的GAN和一个source domain上的模型,然后测试的时候直接将target domain的图片先转换成source domain再进行预测。
对于上述的第二个方向,也有两类方法。一类是人为设计出某个公式,来衡量两个分布之间的距离,一类是利用GAN的框架,利用discriminator来衡量两个分布之间的距离。接下来具体介绍各类的流程:
第一类的方法,例子是这篇论文:“Learning Target-Domain-Specific Classifier for Partial Domain Adaptation,” IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS, VOL. 32, NO. 5, MAY 2021
这类方法主要流程是这样的,用一个网络F1F1F1去提取source domain 图片输入的特征f1f1f1,用一个网络 F2F2F2 去提取 target domain 图片输入的特征 f2f2f2,用一个loss函数 LLL 去计算一个batch下多个f1f1f1和多个f2f2f2这两个集合之间的分布距离 lll,其实理论上,这个loss应该衡量整个source domain和整个target domain两个分布之间的距离的,但一般都采取batch的方式,也就是说从source domain和target domain中分别采样一个batch的子集,那么这个 batch 的 source domain 的图片得到的特征和 target domain 的图片得到的特征之间的距离应该可以代表两个数据集在这个特征空间上的距离。通过减小 lll,就能得到一个domain invariant的特征空间。当然训练过程中同时还会将 f1f1f1 继续前向传播产生预测结果并利用已有的label进行监督训练(一般是图像分类任务)。根据情况,可能会将F1F1F1和F2F2F2共享权重,也就是用一个网络来提取两个domain的特征。所以得到的流程图就类似下面这样(截图自上一点的例子论文"Learning Target-Domain-Specific Classifier for Partial Domain Adaptation"):
第二类方法是利用GAN的流程进行的,简单地说,就是把上述的衡量两个分布之间距离的loss函数改成一个discriminator,通过训练希望让discriminator分不出两个domain生成的feature是哪个domain生成的,从而得到一个domain invariant的特征空间,例子论文是:“Adversarial Discriminative Domain Adaptation”,是2017 CVPR的论文。
流程大概如下面几个图:
而第三个方向的典型论文是这篇2018 CVPR的论文"From source to target and back: Symmetric Bi-Directional Adaptive GAN"把这里的GAN改成了cycleGAN。下面是它的流程:
此外呢,研究domain adaptation的通常都是在分类任务上验证的,其实这些方法也可以应用到具体的其它领域,其实就和目标检测与行人检测的关系是一样的。比如这一篇ECCV2020的文章"YOLO in the Dark - Domain Adaptation Method for Merging Multiple Models",就将domain adaptation的方法用到了黑暗图像目标检测上。
domain adaptation 小综述相关推荐
- 域适应(Domain Adaptation)综述
根据李宏毅老师的视频所归纳的笔记 视频链接:https://www.bilibili.com/video/BV1TL411p7Us?spm_id_from=333.999.0.0 假设我们在训练集上训 ...
- 语义分割-Unsupervised Domain Adaptation in Semantic Segmentation:a Review语义分割中的无监督领域自适应:综述
Unsupervised Domain Adaptation in Semantic Segmentation:a Review语义分割中的无监督领域自适应:综述 0.摘要 1.介绍 1.1.语义分割 ...
- 迁移学习之域自适应理论简介(Domain Adaptation Theory)
©作者 | 江俊广 单位 | 清华大学 研究方向 | 迁移学习 本文主要介绍域自适应(Domain Adaptation)最基本的学习理论,全文不涉及理论的证明,主要是对部分理论的发展脉络的梳理,以及 ...
- 【李宏毅2020 ML/DL】P86-87 More about Domain Adaptation
我已经有两年 ML 经历,这系列课主要用来查缺补漏,会记录一些细节的.自己不知道的东西. 本节内容综述 本节课由助教 Chao Brian 讲解. 首先讲解些领域适配的基础内容,包括名词.定义等. 接 ...
- 域适应(domain adaptation)
文章目录 导读 前言 域适应类别 任务相关性 一步域适应技术及其应用 基于散度的域适应 基于对抗的域适应 基于重建的域适应 结论 导读 在迁移学习中, 当源域和目标的数据分布不同 ,但两个任务相同时, ...
- Deep visual domain adaptation: A survey
参考 Deep visual domain adaptation: A survey - 云+社区 - 腾讯云 摘要 深度视觉域适配作为一个解决大量标注数据缺失的新的学习技巧而出现.与传统的学习共享特 ...
- Open Set Domain Adaptation
本篇是迁移学习专栏介绍的第十篇论文,也算是本专栏专门讲Domain Adaptation的第一篇论文.这篇文章是接受于ICCV 2017,文章的setting是特别新颖的,获得了ICCV Marr P ...
- cross-domin,Domain adaptation 与 Domain generalization学习
参考: [迁移学习]Domain Adaptation系列论文解析(不断更新中) - 知乎 同任务但不同domain数据的统一模型 transfer learning 和 cross domain 有 ...
- 近期必读的9篇CVPR 2019【域自适应(Domain Adaptation)】相关论文和代码
[导读]最近小编推出CVPR2019图卷积网络.CVPR2019生成对抗网络.[可解释性],CVPR视觉目标跟踪,CVPR视觉问答,医学图像分割,图神经网络的推荐相关论文,反响热烈.最近,Domain ...
最新文章
- python selenium unittest_python+selenium+unittest——ui自动化的轻量级选择
- Dubbo3 Triple 协议简介与选型思考
- PHP用支付宝沙箱账号测试支付功能
- (设计模式)简单工厂模式之通过配置文件动态创建实现类
- node.js util全局变量和事件驱动events
- 监听某个区域滚动_监听页面滚动及滚动到指定位置
- php常用编码,简介常见的编码方式
- copy 自定义对象
- Mybatis-03-配置文件及Mybatis主要API详解
- Share Disk、Share Memory和Share Nothing的区别
- c语言12 345 6789,c语言知识点
- 注册公司流程和费用(2016版)
- win7 linux ssh key,Windows下创建SSH Key并登录Linux服务器
- 软件工程复试——二、可行性研究
- 微信小程序tab选项卡,点击弹窗(带蒙版)五星好评-获取微信手机号码
- verilog除法器
- java:浅谈axis调用webservice接口
- 用Python收集这些视频只是单纯的想做做壁纸,大家不要误会
- 安卓简单app《录音机》实现
- ubuntu安装虚拟磁带库mhvtl