Do We Really Need to Access the Source Data? Source Hypothesis Transfer for Unsupervised Domain Adaptation

Introduction

这是无源领域自适应的第一篇论文,之前的领域自适应往往是利用源域模型、源域数据进行迁移。考虑到源域数据的隐私性以及数据的庞大,作者创造性地提出了一种不借助源域数据,只利用从源域上训练出的模型向目标域进行迁移的方法——Source HypOthesis Transfer (SHOT)。

Method

上图是这篇论文提出的整体框架(SHOT),作者的思路很简单,首先利用源域数据有监督地训练出一个模型,然后利用源域模型初始化目标域模型,最后利用目标域数据训练该模型,完成迁移。在整个过程中,模型的分类器(图中的classifier)是固定不动的,也就是不参与训练,直接使用源域训练出来的分类器,我们只需重新训练特征提取器(feature extractor),使其与目标域数据适配。

Source Model Generation

这部分是源域模型的训练,利用卷积神经网络训练一个分类器。损失函数是交叉熵损失函数,不过作者为了提高模型分类的准确性,在损失函数中使用了标签平滑(label smoothing),训练源域模型的损失函数如下所示:

SHOT-IM

这部分作者提出了一个信息最大化(Information
Maximization)的方法进行从目标域到源域的对齐,即让目标域数据的特征和源域有着尽可能相似的分布。作者有着两方面的思考:
1、如果目标域数据和源域数据的差异被消除了,那么目标域数据的输出也应该和源域数据一样,是一个one-hot的形式。由此可联想到熵,只需最小化熵即可达到目的,这部分的损失函数如下:

2、尽可能让目标域数据的分类具有多样性,即每个类别都比较平均,只需计算出整个目标域的输出的平均值,使其熵最大即可。

其中pk是目标域平均输出的第k个分量,也可理解为在第k个类别上输出的平均值。

Self-supervised Pseudo-labeling

上面提出的SHOT-IM方法目的是让目标域的特征与源域对齐,但作者注意到了一个问题,SHOT-IM虽说将两个域的特征分布靠拢,但有可能会将目标域样本分到错误的类别中,如图所示:
可以看出,SHOT-IM确实将特征对齐了,但有的样本还是被分到了错误的类别,针对此问题,作者提出了用伪标签进行自监督的方法,过程类似机器学习中的k-means聚类:

整个过程计算了两次聚类中心,第一次用输出的概率进行加权平均,然后用余弦距离加伪标签,然后用k-means聚类的方法再求一次聚类中心,再用余弦距离加伪标签,这样得到的伪标签较为准确。接着进行自监督,损失函数也是交叉熵损失函数。因此,整个框架的损失函数如下所示:

Experiments

实验代码

无源领域自适应:Source Hypothesis Transfer for Unsupervised Domain Adaptation相关推荐

  1. 【ICML 2015迁移学习论文阅读】Unsupervised Domain Adaptation by Backpropagation (DANN) 反向传播的无监督领域自适应

    会议:ICML 2015 论文题目:Unsupervised Domain Adaptation by Backpropagation 论文地址: http://proceedings.mlr.pre ...

  2. 语义分割-Unsupervised Domain Adaptation in Semantic Segmentation:a Review语义分割中的无监督领域自适应:综述

    Unsupervised Domain Adaptation in Semantic Segmentation:a Review语义分割中的无监督领域自适应:综述 0.摘要 1.介绍 1.1.语义分割 ...

  3. 【ICML 2015迁移学习论文阅读】Unsupervised Domain Adaptation by Backpropagation (DANN) 无监督领域自适应

    会议:ICML 2015 论文题目:Unsupervised Domain Adaptation by Backpropagation 论文地址:http://proceedings.mlr.pres ...

  4. Unsupervised Domain Adaptation for Semantic Segmentation by Content Transfer

    论文链接:https://arxiv.org/abs/2012.12545 此篇论文被AAAI2021接收. 文章目录 1 Motivation 1.1 Domain Gap 1.2 Class Im ...

  5. 【论文阅读】Deep Cocktail Network: Multi-source Unsupervised Domain Adaptation with Category Shift

    Deep Cocktail Network: Multi-source Unsupervised Domain Adaptation with Category Shift SUMMARY@ 2020 ...

  6. CVF2020邻域自适应/语义分割:FDA: Fourier Domain Adaptation for Semantic SegmentationFDA:用于语义分割的傅立叶域自适应算法

    邻域自适应/语义分割:FDA: Fourier Domain Adaptation for Semantic Segmentation FDA:用于语义分割的傅立叶域自适应算法 0.摘要 1.概述 1 ...

  7. CVPR2019:Domain-Specific Batch Normalization for Unsupervised Domain Adaptation无监督域适配的特定域批处理规范化

    CVPR2019:Domain-Specific Batch Normalization for Unsupervised Domain Adaptation无监督域适配的特定域批处理规范化 0.摘要 ...

  8. 论文笔记:An Adaptive Feature Norm Approach for Unsupervised Domain Adaptation

    论文链接 最近把毕业论文的题目确定了,这个专栏专门放相关论文的阅读笔记,个人理解可能有限,欢迎大家指正! 标题理解 阅读论文之前,首先对标题进行一定的理解,才能更好的理解论文的内容. 论文完整标题为: ...

  9. 《Weighted Maximum Mean Discrepancy for Unsupervised Domain Adaptation》论文阅读

    Weighted Maximum Mean Discrepancy for Unsupervised Domain Adaptation 摘要 类先验分布(Class prior distributi ...

最新文章

  1. WebService与使用风格RPC/SOA/REST
  2. [hdu1847]博弈,推理
  3. RAID冗余技术的介绍AND实现
  4. Cutting Codeforces Round #493 (Div. 2)
  5. UVA 125 Numbering Paths
  6. 重学前端----前端知识系统学习推荐专栏
  7. python 中BeautifulSoup入门
  8. 12-Factor与云原生
  9. linux 6.3 ftp安装,CentOS6.3下安装VSFTP服务
  10. 自考--网络经济与企业管理--选择易考题
  11. 两次DFS,POJ(1481)
  12. SQL Server 2005 Beta 2 Service Broker: Stored Procedure acts as a service program
  13. FPGA之三八译码器
  14. 正确的价值观和干部队伍引领华为走向长久成功
  15. android的popwindow控件,及控件设为圆角
  16. opencv分别显示彩色图片各通道图片
  17. NF-ResNet:去掉BN归一化,值得细读的网络信号分析 | ICLR 2021
  18. git基础教程(11) git checkout命令,掌握这些足以
  19. Mac使用Karabiner-Elements修改mac默认快捷键
  20. mysql是什么?mysql的特点

热门文章

  1. CMDN Club #20 活动预告: 从粉笔网多终端产品快速开发说开去——移动创业产品的架构和项目管理(10月10日)...
  2. Ubuntu下磁盘管理
  3. 我一个高考英语94的渣渣是怎么通过四六级的(学习方法技巧)
  4. 将JAVA bean/实体类 中为null的属性值转换成空字符串
  5. 《Google软件工程》读书笔记
  6. maven中遇到的问题,报错
  7. 【学习笔记】ACP敏捷项目管理
  8. 高级PHP工程师必备的编码技巧及思维(收藏)
  9. 什么叫诚实_诚信是什么
  10. java中随机点名器的简单程序