一篇综述带你全面了解迁移学习的领域泛化(Domain Generalization)
领域泛化 (Domain Generalization, DG) 是近几年非常热门的一个研究方向。它研究的问题是从若干个具有不同数据分布的数据集(领域)中学习一个泛化能力强的模型,以便在 未知 (Unseen) 的测试集上取得较好的效果。本文介绍DG领域的第一篇综述文章《Generalizing to Unseen Domains: A Survey on Domain Generalization》。该论文一共调研了 160篇 文献,其中直接与领域泛化相关的有 90 篇。文章从问题定义、理论分析、方法总结、数据集和应用介绍、未来研究方向等几大方面对领域泛化问题进行了详细的概括和总结。
该论文的精简版已被国际人工智能顶会IJCAI-21录用。
文章链接:https://arxiv.org/abs/2103.03097
PDF:https://arxiv.org/pdf/2103.03097
作者单位:微软亚洲研究院、中央财经大学
问题定义
领域泛化问题与领域自适应 (Domain Adaptation,DA)最大的不同:DA在训练中,源域和目标域数据均能访问(无监督DA中则只有无标记的目标域数据);而在DG问题中,我们只能访问若干个用于训练的源域数据,测试数据是不能访问的。毫无疑问,DG是比DA更具有挑战性和实用性的场景:毕竟我们都喜欢“一次训练、到处应用”的足够泛化的机器学习模型。
例如,在下图中,DA问题假定训练集和测试集都可以在训练过程中被访问,而DG问题中则只有训练集。
DG问题的示意图如下所示,其形式化定义如下:
DG不仅与DA问题有相似之处,其与多任务学习、迁移学习、元学习、终身学习等,都有一些类似和差异之处。我们在下表中对它们的差异进行了总结。
理论
我们从Domain adaptation理论出发,分析影响不同领域学习结果的因素,如 -divergence、 divergence等,继而过渡到领域Domain generalization问题中,分析影响模型泛化到新领域的因素。从理论上总结了领域泛化问题的重要结果,为今后进行相关研究指明了理论方向。
详细结果请参考原文第3部分。
方法
领域泛化方法是我们的核心。我们将已有的领域泛化方法按照数据操作、表征学习、学习策略分为三大方面,如下图所示。
其中:
- 数据操作,指的是通过对数据的增强和变化使训练数据得到增强。这一类包括数据增强和数据生成两大部分。
- 表征学习,指的是学习领域不变特征(Domain-invariant representation learning)以使得模型对不同领域都能进行很好地适配。领域不变特征学习方面主要包括四大部分:核方法、显式特征对齐、领域对抗训练、以及不变风险最小化(Invariant Risk Minimiation, IRM)。特征解耦与领域不变特征学习的目标一致、但学习方法不一致,我们将其单独作为一大类进行介绍。
- 学习策略,指的是将机器学习中成熟的学习模式引入多领域训练中使得模型泛化性更强。这一部分主要包括基于集成学习和元学习的方法。同时,我们还会介绍其他方法,例如自监督方法在领域泛化中的应用。
在文章中,我们对每大类方法都进行了详细地介绍与总结。
应用与数据集
领域泛化问题在众多领域都得到了广泛应用。大多数已有工作偏重于设计更好的DG方法,因此,其往往都在图像分类数据上进行评估。除此之外,DG方法还被应用于行人再识别(Re-ID)、语义分割、街景识别、视频理解等计算机视觉的主流任务中。
特别地,DG方法被广泛应用于健康医疗领域,例如帕金森病识别、组织分割、X光胸片识别、以及震颤检测等。
在自然语言处理领域,DG被用于情感分析、语义分割、网页分类等应用。
DG也在强化学习、自动控制、故障检测、语音检测、物理学、脑机接口等领域中得到了广泛应用。
下图展示了领域泛化问题中流行的标准数据集。
未来挑战
我们对DG进行以下展望:
- 连续领域泛化:一个系统应具有连续进行泛化和适配的能力,目前只是离线状态的一次应用。
- 新类别的领域泛化:目前我们假定所有的领域具有相同的类别,未来需要扩展到不同类别中、乃至新类别中。
- 可解释的领域泛化:尽管基于解耦的方法在可解释性上取得了进步,但是,其他大类的方法的可解释性仍然不强。未来需要对它们的可解释性进行进一步研究。
- 大规模预训练与领域泛化:众所周知,大规模预训练(如BERT)已成为主流,那么在不同问题的在规模预训练中,我们如何利用DG方法来进一步提高这些预训练模型的泛化能力?
- 领域泛化的评价:尽管有工作在经验上说明已有的领域泛化方法的效果并没有大大领先于经验风险最小化,但其只是基于最简单的分类任务。我们认为DG需要在特定的评测,例如行人再识别中才能最大限度地发挥其作用。未来,我们需要找到更适合DG问题的应用场景。
一篇综述带你全面了解迁移学习的领域泛化(Domain Generalization)相关推荐
- 迁移学习系列--领域泛化
迁移学习的核心就是通过减少源域和目标域之间的分布差异,进而利用源域信息完成目标域的学习.与领域自适应问题强调适配源域与目标域之间的数据分布相比,领域泛化更强调有源域学习到的模型可以泛化到任意新出现的领 ...
- 一篇综述带你全面了解课程学习(Curriculum Learning)
本文转自知乎,已获作者授权转载,请勿二次转载. 原文:https://zhuanlan.zhihu.com/p/362351969 导读:课程学习 (Curriculum learning, CL) ...
- 14 篇论文为你呈现「迁移学习」研究全貌 | 论文集精选 #04
PaperWeekly 是一个 AI 学术分享社区.这里聚集了大批一线 AI 学者,他们用精炼妙语推荐各自发现的优质论文.点击本文底部的「阅读原文」即刻加入社区,创建属于你的论文集. 这里是第 4 期 ...
- 手把手带你入坑迁移学习(by 当过黑客的CTO大叔)
原作 Slav Ivanov Root 编译自 Slav寄几的博客 量子位 出品 | 公众号 QbitAI Slav Ivanov是Post Planer(提高社交媒体影响力的App)的CTO,这个当 ...
- 迁移学习:领域自适应的理论分析
点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 领域自适应即Domain Adaptation,是迁移学习中很重要 ...
- YOLO3 + Python3.6 深度学习篇(上)- Transfer Learning 迁移学习
何为 YOLO(You Only Look Once) YOLO [点击] 充满青春暗示的另一面,更是一个强大物体检测算法的简称,其算法结合了速度与准确度,近期更推出了第三版的 model 供大家参考 ...
- 还在为不知道怎么学习网络安全而烦恼吗?这篇文带你从入门级开始学习网络安全—认识网络安全
随着网络安全被列为国家安全战略的一部分,这个曾经细分的领域发展提速了不少,除了一些传统安全厂商以外,一些互联网大厂也都纷纷加码了在这一块的投入,随之而来的吸引了越来越多的新鲜血液不断涌入. 不同于Ja ...
- 基于特征的对抗迁移学习论文_学界 | 综述论文:四大类深度迁移学习
选自arXiv 作者:Chuanqi Tan.Fuchun Sun.Tao Kong. Wenchang Zhang.Chao Yang.Chunfang Liu 机器之心编译 参与:乾树.刘晓坤 本 ...
- 《A Survey on Transfer Learning》迁移学习研究综述 翻译
迁移学习研究综述 Sinno Jialin Pan and Qiang Yang,Fellow, IEEE 摘要: 在许多机器学习和数据挖掘算法中,一个重要的假设就是目前的训练数据和将来的训练数据 ...
最新文章
- Linux网络服务基础
- JBPM6教程-10分钟玩转JBPM工作台
- 注解@NotNull/@NotEmpty/@NotBlank
- linux内核5.4,Linux Kernel 5.4 RC8 发布,一切都很正常
- mysql 不能用dbcontext_EntityFramework中的DbContext使用疑点说明
- Transformer可以不需要Softmax?Kakao提出了UFO-ViT,性能高,计算量还小
- 高性能网站建设指南——网站优化的14条建议
- android wifi是否可用,Android检测网络连接是否可用
- React-Native开发App,修改图标和名字
- matlab pdetool解热传导方程,传热学与应用(李晓炜)基于pdetool的热传导数值计算.pdf...
- 傅里叶分析(通俗解释)
- 内存颗粒和闪存颗粒的区别_内存颗粒及频率知识,你真的清楚吗?
- Pytorch实现EfficientNet
- 使用 Entrust 扩展包在 Laravel 5 中实现 RBAC 权限管理与安装配置
- 虚幻4渲染编程(材质编辑器篇)【第三卷:正式准备开始材质开发】
- 怎样更改软件默认安装路径由C盘到其他盘
- ORA-03113数据库无法正常启动
- 同步以太网-SyncE介绍
- 多线程(一)线程与进程、Thread
- 计算机科学导论(6):操作系统