这篇论文从任务的难度来解决领域泛化问题,论文认为如果模型的学习任务太难的话,容易发生过拟合,学习到的特征是域特有的特征而不是域不变特征,这样很难学习到泛化的特征。因此论文假设简单的任务可以提高目标域的泛化性能。论文提出了对于域泛化的知识蒸馏(KDDG),在知识蒸馏框架基础上使用梯度滤波器作为正则化项,提高模型泛化能力。

采用知识蒸馏模型,可以让学生网络学习更少的领域特定特征,达到更好泛化能力。教师网络给学生网络提供soft label,含有更多的信息量,可以让学生网络学习的任务更简单,可以学习到更加general和comprehensive的feature。教师网络和学生网络之间的蒸馏损失是式(2),学生网络的总损失是蒸馏损失和学生网络的输出与hard label之间交叉熵损失的加权和式(3)。

梯度滤波器只应用于学生网络的训练。gradient filter的设置如式(4)所示,ω代表梯度,η是控制filter强度的超参数。梯度滤波器可以视为对损失函数施加权重。梯度滤波器可以防止学生网络与教师网络过于相似,也可以过滤掉与high score输出相对应的梯度,可以避免over-confidence的问题。在每次迭代中,梯度滤波器检查每个样本的置信度,并降低置信度得分高于预定义阈值的样本的梯度权重。

采用了梯度滤波器后的模型域泛化的综合损失可以表示为式(8),ε是避免教师模型的错误预测产生的负面影响。

参考文献

  1. Wang Y, Li H, Chau L, et al. Embracing the Dark Knowledge: Domain Generalization Using Regularized Knowledge Distillation[C]//Proceedings of the 29th ACM International Conference on Multimedia. 2021: 2595-2604.

【领域泛化论文阅读】Embracing the Dark Knowledge: Domain Generalization Using RegularizedKnowledgeDistillation相关推荐

  1. 【领域泛化论文阅读】Semantic-Aware Domain Generalized Segmentation

    关于图像白化和色彩变换的基本内容可以参考: 图像标准化.图像白化.色彩变换_S L N的博客-CSDN博客 论文是针对语义分割的领域泛化模型.论文提出了SAN和SAW两个模块来增强类别之间的分离,类内 ...

  2. 【领域泛化论文阅读】Generalizing to Unseen Domains: A Survey on Domain Generalization

    传统的机器学习是假设训练数据和测试数据独立同分布进行训练的,当训练数据和测试数据的分布不同,也就是域分布不同时,模型的性能将大大下降.而迁移学习是在训练数据和测试数据服从不同的数据的概率分布时,提高模 ...

  3. 【领域泛化论文阅读】Birds of A Feather Flock Together:Category-Divergence Guidance for DomainAdaptiveSegmentat

    论文提出了一个分层的无监督的领域自适应框架用于跨领域的语义分割.类间分离,类内聚合的机制(ISIA). 针对语义分割的无监督领域自适应(UDA)的方法可以分为image-level,feature-l ...

  4. [软件自动修复领域] 前沿论文阅读(2019年8月12日)

    文章目录 前言 论文列表 Automated Program Repair: A Step towards Software Automation Getafix: Learning to fix b ...

  5. 论文阅读:IDM: An Intermediate Domain Module for Domain Adaptive Person Re-ID

    论文阅读:IDM: An Intermediate Domain Module for Domain Adaptive Person Re-ID(ICCV 2021) 任务:UDA ReID 论文地址 ...

  6. 论文阅读笔记—Reasoning on Knowledge Graphs with Debate Dynamics(AAAI,2020)

    这是一篇非常有趣的工作,看完会觉得眼前一亮. 论文标题:Reasoning on Knowledge Graphs with Debate Dynamics 发表于AAAI,2020 动机  很多机器 ...

  7. 论文阅读《How Does Knowledge Graph Embedding Extrapolate to Unseen Data: A Semantic Evidence View》

    https://arxiv.org/abs/2109.11800 https://github.com/renli1024/SE-GNN 论文概览 现有的KGE工作大多集中在精巧的三元组建模函数的设计 ...

  8. 【论文阅读】Learning Hierarchy-Aware Knowledge Graph Embeddings for Link Prediction

    <Learning Hierarchy-Aware Knowledge Graph Embeddings for Link Prediction> 论文来源:EMNLP2020 论文链接: ...

  9. 论文阅读2 Learning Hierarchy-Aware Knowledge Graph Embeddings for Link Prediction

    目录 问题 创新 1.Introduction 2.相关工作 3.HAKE模型 原文:[1911.09419] Learning Hierarchy-Aware Knowledge Graph Emb ...

最新文章

  1. 这几款嵌入式软件测试工具,好用到起飞~
  2. SpringBoot 之 普通类获取Spring容器中的bean
  3. ASP.NET MVC:WebPageBase.cs
  4. gorm 返回多条数据_如何优雅的操作数据库?
  5. UOJ#37. 【清华集训2014】主旋律
  6. 数据科学包12-实例1:股票数据分析
  7. 在VS中格式化代码 快捷键
  8. K3-openwrt交换机模式-挂载磁盘-部署kodexplorer可道云私有云盘-极简单版
  9. pwm占空比的c语言编程详解,灵动微MM32F003硬件最小系统 --- PWM占空比从0%到100%例程解析【18】...
  10. 彩扩机项目--两个状态指示灯,巧妙的使用二极管的特性,以及物理按键的滤波...
  11. Springer-Verlag免费下载图书400本
  12. Red Team之Empire渗透工具介绍和使用
  13. 【TensorFlow】DNNRegressor 的简单使用
  14. HEVC亮度分量帧内预测模式代码详解
  15. 闭区间上连续函数的性质
  16. 程序员到底应该学什么?!
  17. 如何通过cmd开一个本地服务器
  18. JAVA实现MD5带盐加密_MD5加盐加密
  19. c# datatable数据合并方法
  20. 用matlab读csv数据_matlab 读文件csvread textread用法实例

热门文章

  1. OpenCV学习 查表函数LUT C++
  2. java mvvm框架实例_什么是MVVM框架?
  3. ChatGPT实战:高考志愿填报
  4. plc secs通讯协议_SECS/GEM解决方案:PLC与MES间的通讯
  5. python求本原根
  6. 大话脑影像:浅谈影像组学
  7. 程序员应该掌握的10个搜索技巧
  8. 央行货币与私人货币:经济学家Eswar Prasad谈“货币的未来”
  9. 安装配置neovim详细教程
  10. 魔力耳朵java工作,魔力耳朵