介绍

DG:将从多个源域学习到的知识泛化到未知域上,主要的方法是利用统计模型对数据和标签之间的依赖关系进行建模,从而学习到独立于域的表示。然而,当依赖性随目标分布而变化时,统计模型可能无法泛化。
于是,作者引入了一个通用的结构因果模型来形式化 DG 问题。具体来说,假设每个输入都是由因果因素(与标签的关系跨域不变)和非因果因素(与类别无关)混合构成的,只有前者会导致分类判断。目标是从输入中提取因果因素,然后重建不变的因果机制。然而,由于没有观察到所需的因果/非因果因素,因此理论上的想法远非 DG 的实际应用。理想的因果因素应满足三个基本属性:与非因果因素分开、共同独立以及对分类有足够的因果关系。基于此,提出了一种因果关系启发表示学习(CIRL)算法,该算法强制表示满足上述属性,然后使用它们来模拟因果因素,从而提高泛化能力。


如图1所示,作者的目标是从原始输入X中提取因果因素S,然后重建不变的因果机制。但无法直接将原始输入分解为因果因素和非因果因素,因为因果/非因果因素通常是未被观察到且无法表述的。

假设输入数据都由两部分组成,因果的决定数据类别标签的因果变量S,和与分类无关的非因果变量U,目标是从输入中提取因果变量S,并重建真正域不变的因果机制S->Y,考虑到因果和非因果变量都是不可观测的,通过学习具有因果变量的表征来学习因果变量。
因果因素S应满足三个性质:
1)与非因果因素U分开;图a中因果变量S和非因果变量U的混合导致S中包含了一些底层的非因果信息。
2)S的因式分解应该是联合独立的; 图a中相互纠缠的因果变量会使S包含冗余信息,同时导致遗漏 了底层的一些因果信息。
3)在包含所有因果信息的意义上,对于分类任务 X -→ Y 是因果足够的。

如图2所示,与 U 的混合导致 S 包含潜在的非因果信息,而联合相关因式分解使 S 冗余,进一步导致一些潜在的因果信息的遗漏。相比之下,图 2(b)中的因果因素 S 是满足所有要求的理想因素。受此启发,作者提出了一种因果关系启发表示学习(CIRL)算法,强制学习的表示具有上述属性,然后利用表示的每个维度来模拟因果因素的分解,具有更强的泛化能力。

统计依赖:在观察到X=x的条件下预测y,这种关系是随着数据分布而变化的,还可能存在虚假相关性。
因果机制:在设置X=x的条件下预测y,这种关系是随数据分布保持不变的,并且变量间存在因果关系必然导致变量间存在统计关系。但变量间存在统计相关性并不以为着二者间存在因果相关性。

方法


因果干预模块:将因果因素S从非因果因素U的混合物中分类出来。通过干扰信息对非因果因素U进行干预,同时保持相位信息不变。
因果分解模块:因果因素的分解应该是共同独立的,因为它们不包含其他人的信息。通过最小化因果分解损失将嘈杂和相关的表示变成干净而独立的表示。
对抗掩码模块:构建了一个基于神经网络的Masker来检测劣质尺寸。通过最小化上确界和最大化下确界的分类损失来优化Masker,同时通过最小化两个监督损失来优化生成器和分类器。该模块迭代地检测包含相对较少因果信息的维度,并通过掩码器和表示生成器之间的对抗性学习迫使它们包含更多和新颖的因果信息。

实验




有表2和表3可知:CIRL 在两个主干上的所有比较方法中获得了最高的平均准确度

如图4所示:与基线方法相比,CIRL 学习的表示与类别相关性更高。以长颈鹿为例,它的长脖子可以看作是分类的因果因素之一,这正是CIRL捕捉到的。而基线侧重于非因果因素(例如,类似于鬃毛的纹理),这会导致错误分类。补充材料中给出了更多的可视化结果。

Causality Inspired Representation Learning for Domain Generalization 阅读笔记相关推荐

  1. 活体检测 Adaptive Normalized Representation Learning for GeneralizableFace Anti-Spoofing 阅读笔记

    论文链接:Adaptive Normalized Representation Learning for Generalizable Face Anti-Spoofing | Proceedings ...

  2. Deep High-Resolution Representation Learning for Visual Recognition阅读笔记

    用于视觉识别的深度高分辨率表示学习 论文链接 摘要: 高分辨率表示对于人体姿态估计.语义分割和目标检测这类位置敏感的视觉问题至关重要.现有的 sota 框架首先通过串联 high-to-low 分辨率 ...

  3. CYCADA: cycle-consistent adversaial domain adaption阅读笔记

    CYCADA: cycle-consistent adversaial domain adaption阅读笔记 目录 CYCADA: cycle-consistent adversaial domai ...

  4. “Self-Challenging Improves Cross-Domain Generalization”阅读笔记

    "Self-Challenging Improves Cross-Domain Generalization"阅读笔记 1 Motivation 1) 分类模型在域内取得了很好的判 ...

  5. Deep Domain Confusion:Maximinzing for Domain Invariance阅读笔记

    摘要 近期研究表明,通常而言,一个在大量数据上训练的监督学习深度CNN模型可以减少但是不能移除一个标准基准上的数据集偏差.在新的域内使用基于微调的深度模型对数据量有很高的需求,这种限制使得这种方法在很 ...

  6. Few-Shot Representation Learning for Out-Of-Vocabulary Words 论文笔记

    <Few-Shot Representation Learning for Out-Of-Vocabulary Words> 这篇文章是发表在2019年NAACL上的,主要是针对out o ...

  7. Rule-Guided Compositional Representation Learning on Knowledge Graphs-学习笔记

    Rule-Guided Compositional Representation Learning on Knowledge Graphs 1.表示学习知识图谱(KG)是将KG的实体和关系嵌入到低维连 ...

  8. Adversarial Discriminative Domain Adaption 阅读笔记

    文章发表于 CVPR 2017 文章利用GAN网络的思想用于cross-domain识别 文章首先提到 1 先前的生成网络不适用于大的domain shift 2 先前的辨别网络施加固定的权重,没有利 ...

  9. Clustered Federated Learning 论文源码阅读笔记

    本篇文章的阅读论文是<Clustered Federated Learning: Model-Agnostic Distributed Multitask Optimization Under ...

最新文章

  1. 设置tabbaritem的title的颜色及按钮图片
  2. 2010年5月21日 下雨了
  3. java socket 重连复用,20190818 On Java8 第八章 复用
  4. 自己动手利用KVM和Intel VT实现简单虚拟机
  5. MyBatis关键配置-接口的扫描注册
  6. mqtt java_MQTT和Java入门
  7. SparkSQL自定义AVG强类型聚合函数与弱类型聚合函数汇总
  8. apache php 脚本,PHP脚本不在Apache服务器上执行
  9. 华为 AppGallery Connect 构建游戏分发能力,赋能游戏全生命周期
  10. mysql 安装导航_ubuntu下安装Mysql
  11. 计算机毕设(附源码)JAVA-SSM基于JAVA宠物店管理系统
  12. 高斯过程回归预测 C++代码实现
  13. 微信小程序——拼图游戏案例
  14. “我与正大光明眼科集团共成长”主题演讲比赛精彩回顾
  15. 2019智慧树python答案大全_2020智慧树知到Python程序设计参考答案
  16. 解读 2022 诺贝尔生理学或医学奖 | MedChemExpress
  17. 人力资源管理信息系统
  18. 【Rust日报】2022-07-20 极简主义 Poem 指南
  19. Elasticsearch查询时还在百度DSL语句吗?你可能需要这份总结
  20. error LNK2005: _DllMain@12 已经在 MSVCRTD.lib(dllmain.obj) 中定义

热门文章

  1. 【Matlab】ASCII图片生成、迷宫生成和词云图生成
  2. Angular 个人深究(一)【Angular中的Typescript 装饰器】
  3. Exp8 web基础 20164323段钊阳
  4. 我们为什么做Banana Pi开源硬件项目:
  5. 局域网访问提示无法访问检查拼写_windows无法访问请检查名称的拼写… 错误代码:0x80070035 | 吴文辉博客...
  6. EOS区块链技术开发(二)智能合约
  7. K8S使用habor作为私有仓库
  8. MySQL pt工具应用
  9. 【19C】logmnr参考
  10. 编写SQL语句,从Customers中检索所有的顾客名称(cust_name),并按从Z到A的顺序显示结果