paper list

  • A DIRT-T Approach to Unsupervised Domain Adaptation

Main Idea

这篇文章针对之前的domain adversarial learning的方法进行了批判,并通过引入聚类假设和Mean Teacher-liked的self-ensembling方法解决对抗机制的缺点,以至于可以获得更好的泛化分类性能。

本文一共提出了两个模型:

  1. VADA Virtual Adversarial Domain Adaptation model
  2. DIRT-T Decision-boundary Iterative Refinement Training with a Teacher

其实严格意义上第二个模型是在VADA的基础上的一个改进方法,并不是一个独立的模型。

Domain Adversarial的缺点

这篇文章提出之前的对抗学习的方式有两个缺点:

  • 当特征提取器的能力过于强大,即输出的特征拟合能力很强的时候,强行将特征进行匹配是一个很弱的约束规则。如果一个特征提取器的输出特征是high-capacity的,那么理论上它可以将从target提取的特征直接拟合到source的特征分布上。问题是这样的拟合不会提升在target上的分类准确率。
  • 在non-conservative domain adaptation情况下(单个分类器无法同时在source和target上获得最好的分类效果),如果训练一个在source上表现太好,整个模型向source的方向偏移,势必会影响在target上的分类正确率。(中庸的思想,过犹不及)

VADA

这个模型相比于传统的DANN的对抗结构加入了聚类假设相关的惩罚项。聚类假设是对于网络的输入(image)分布是满足聚类算法的假设,即分类器边界不会穿过分布的高密度区域。所以提出了两个相关的惩罚项,一个是在输出特征上加入最小熵约束,让不同类别的特征尽可能的分离开,远离分类器的决策边界。二是计算输出特征和其轻微扰动的KL散度,在每个样本x的法向球邻域内强制分类器一致性。所以总的损失函数:
min⁡θ.Ly(θ;Ds)+λdLd(θ;Ds,Dt)+λsLv(θ;Ds)+λt[Lv(θ;Dt)+Lc(θ;Dt)]\min\limits_{\theta}.L_{y}(\theta;D_{s}) + \lambda_{d}L_{d}(\theta;D_{s}, D_{t})+\lambda_{s}L_{v}(\theta;D_{s})+\lambda_{t}[L_{v}(\theta;D_{t}) + L_{c}(\theta;D_{t})] θmin​.Ly​(θ;Ds​)+λd​Ld​(θ;Ds​,Dt​)+λs​Lv​(θ;Ds​)+λt​[Lv​(θ;Dt​)+Lc​(θ;Dt​)]

其中每一部分的具体表示:

Lt(θ)=Lv(θ;Dt)+Lc(θ;Dt)L_{t}(\theta )=L_{v}(\theta;D_{t}) + L_{c}(\theta;D_{t})Lt​(θ)=Lv​(θ;Dt​)+Lc​(θ;Dt​)
Lv(θ;D)=Ex∼D[max⁡∥r∥≤εDKL(hθ(x+r))]L_{v}(\theta;D)=E_{x\sim D}\left [ \max \limits_{\left \| r \right \| \leq\varepsilon}D_{KL}(h_{\theta}(x+r)) \right ]Lv​(θ;D)=Ex∼D​[∥r∥≤εmax​DKL​(hθ​(x+r))]
Lc(θ;Dt)=−Ex∼Dt[hθ(x)⊤ln⁡hθ(x)]L_{c}(\theta;D_{t}) = - E_{x\sim D_{t}}[h_{\theta}(x)^{\top}\ln h_{\theta}(x)]Lc​(θ;Dt​)=−Ex∼Dt​​[hθ​(x)⊤lnhθ​(x)]

总体的模型结构图:

DIRT-T

在一个训练好的VADA网络的基础上,这篇文章设计了一个新的增强方法去提高性能。这个方法只使用target的数据,借鉴了Mean Teacher方法的思想,继续深入贯彻落实聚类假设,即加大聚类中心之间的距离,让数据分布远离分类边界。

这里的DIRT-T方法更像一个two-stages训练方法的第二个stage,这个阶段的损失函数:
min⁡θn.λtLt(θn)+βtE[DKL(hθn−1(x)∥hθn(x))]\min\limits_{\theta_{n}}.\lambda_{t}L_{t}(\theta_{n})+\beta_{t}\mathbb{E}[D_{KL}(h_{\theta_{n-1}}(x)\parallel h_{\theta_{n}}(x))] θn​min​.λt​Lt​(θn​)+βt​E[DKL​(hθn−1​​(x)∥hθn​​(x))]

最后文章进行了一些测试和Ablation Study,证明了VADA加入的virtual adversarial training部分和DIRT-T增强方法的两个部分都是有效的,但是实验测试的数据集没有大规模数据集,有待进一步的测试。

本人个人博客主页:https://www.frankzhang.tech/

文献下载地址

https://arxiv.org/pdf/1802.08735.pdf

paper report: DIRT-T相关推荐

  1. KDD 2017 参会报告

    本次参会报告由技术发展部黑屏:阿里云飞天一部杰铭.布晓.吴双:阿里妈妈产品技术部永叔.怀人:集团安全部裕宏等同学一起撰写.希望大家积极交流,踊跃发表看法. 一 背景:(杰铭) KDD的全称是ACM S ...

  2. 人工神经网络实验项目:论文复现

    目录 Lab Course Project Lab Project Lab Project Report **Choosen Paper:** [Learning Rich Features for ...

  3. 中英文论文写作指导第二部分(前言)

    目录 1.0 前言的概念和作用 2.0 前言的主要内容 3.0 前言的时态要求 4.0 撰写前言的步骤 4.1 背景资料 4.2 文献回顾 4.3 提出问题 4.4 研究目的 4.5 研究价值 4.6 ...

  4. UReport2 多报表文件打印,ZIP下载实现

    项目中报表较多,客户要求多报表 zip下载或打印,查看ureport内部代码实现,代码相对简单,直接上代码. 实现了多文件混合zip下载,基于浏览器的打印和Lodop打印插件两种方式. Java代码 ...

  5. WIDER FACE AND PEDESTRIAN CHALLENGE - WIDER CHALLENGE

    WIDER FACE AND PEDESTRIAN CHALLENGE - WIDER CHALLENGE http://wider-challenge.org/ CHALLENGE TRACKS W ...

  6. CVPR 2011 全部论文标题和摘要

    CVPR 2011 Tian, Yuandong; Narasimhan, Srinivasa G.; , ■Rectification and 3D reconstruction of curved ...

  7. Paper:《GPT-4 Technical Report》的翻译与解读

    Paper:<GPT-4 Technical Report>的翻译与解读 目录 Paper:<GPT-4 Technical Report>的翻译与解读 Abstract摘要 ...

  8. 【知乎热议】如何看待swin transformer成为ICCV2021的 best paper?

    编辑:深度学习技术前沿 转载请注明来源,谢谢! [导读]今年ICCV2021, 在所有被接收的论文中,来自中国的论文数量占比最高,达到了 43.2%,约为第二位美国(23.6%)的两倍.中国学者凭借S ...

  9. Paper:《A Few Useful Things to Know About Machine Learning—关于机器学习的一些有用的知识》翻译与解读

    Paper:<A Few Useful  Things to  Know About  Machine  Learning-关于机器学习的一些有用的知识>翻译与解读 目录 <A Fe ...

  10. Paper:《First Order Motion Model for Image Animation》翻译与解读

    Paper:<First Order Motion Model for Image Animation>翻译与解读 目录 <First Order Motion Model for ...

最新文章

  1. [ZZ]STM32之RCC
  2. C语言中printf是不是关键字,C语言中printf是什么意思
  3. Syn Bot /OSCOVA 上下文(8)
  4. Flutter React编程范式实践
  5. GDCM:gdcm::Object的测试程序
  6. Netty 4.0 新的特性及需要注意的地方
  7. 计算机维护系统Win8PE,win8如何进入PE重装电脑系统
  8. js html转为实体,字符串js编码转换成实体html编码的方法(防范XSS攻击)
  9. java更改reader字体颜色,Java 修改 文件内容 and BufferedReader 乱码问题
  10. android文件管理器--界面效果二(layout)
  11. visio2019 专业版,两种方法
  12. [原]procexp替换任务管理器
  13. 大学一年级计算机组成语结构试题,一年级下册期末复习习题
  14. Excel使用技巧之分割字符串
  15. Ubuntu可视化监控温度
  16. django之csrf_exempt解决跨域请求的问题
  17. CANopen协议本质
  18. 955 不加班公司名单:955.WLB
  19. crosstool-ng 交叉工具链默认配置 名词解释
  20. 基于springBoot的记账系统

热门文章

  1. Netflix Web 性能案例研究
  2. python求不规则图形面积_使用Python生成不规则形状的图形
  3. ios微信小程序下拉刷新怎么配_微信小程序之上拉加载与下拉刷新
  4. PointRCNN: 3D Object Proposal Generation and Detection from Point Cloud【翻译】
  5. 互联网周刊:草根创业选择题
  6. web网站添加ico图标
  7. firefox无法显示flash问题解决
  8. 计算机辅助翻译工具客户端,OmegaT(计算机辅助翻译软件)
  9. linux系统忘记密码之破解密码
  10. 秋天是一个思念的季节