paper report: DIRT-T
paper list
- A DIRT-T Approach to Unsupervised Domain Adaptation
Main Idea
这篇文章针对之前的domain adversarial learning的方法进行了批判,并通过引入聚类假设和Mean Teacher-liked的self-ensembling方法解决对抗机制的缺点,以至于可以获得更好的泛化分类性能。
本文一共提出了两个模型:
- VADA Virtual Adversarial Domain Adaptation model
- DIRT-T Decision-boundary Iterative Refinement Training with a Teacher
其实严格意义上第二个模型是在VADA的基础上的一个改进方法,并不是一个独立的模型。
Domain Adversarial的缺点
这篇文章提出之前的对抗学习的方式有两个缺点:
- 当特征提取器的能力过于强大,即输出的特征拟合能力很强的时候,强行将特征进行匹配是一个很弱的约束规则。如果一个特征提取器的输出特征是high-capacity的,那么理论上它可以将从target提取的特征直接拟合到source的特征分布上。问题是这样的拟合不会提升在target上的分类准确率。
- 在non-conservative domain adaptation情况下(单个分类器无法同时在source和target上获得最好的分类效果),如果训练一个在source上表现太好,整个模型向source的方向偏移,势必会影响在target上的分类正确率。(中庸的思想,过犹不及)
VADA
这个模型相比于传统的DANN的对抗结构加入了聚类假设相关的惩罚项。聚类假设是对于网络的输入(image)分布是满足聚类算法的假设,即分类器边界不会穿过分布的高密度区域。所以提出了两个相关的惩罚项,一个是在输出特征上加入最小熵约束,让不同类别的特征尽可能的分离开,远离分类器的决策边界。二是计算输出特征和其轻微扰动的KL散度,在每个样本x的法向球邻域内强制分类器一致性。所以总的损失函数:
minθ.Ly(θ;Ds)+λdLd(θ;Ds,Dt)+λsLv(θ;Ds)+λt[Lv(θ;Dt)+Lc(θ;Dt)]\min\limits_{\theta}.L_{y}(\theta;D_{s}) + \lambda_{d}L_{d}(\theta;D_{s}, D_{t})+\lambda_{s}L_{v}(\theta;D_{s})+\lambda_{t}[L_{v}(\theta;D_{t}) + L_{c}(\theta;D_{t})] θmin.Ly(θ;Ds)+λdLd(θ;Ds,Dt)+λsLv(θ;Ds)+λt[Lv(θ;Dt)+Lc(θ;Dt)]
其中每一部分的具体表示:
Lt(θ)=Lv(θ;Dt)+Lc(θ;Dt)L_{t}(\theta )=L_{v}(\theta;D_{t}) + L_{c}(\theta;D_{t})Lt(θ)=Lv(θ;Dt)+Lc(θ;Dt)
Lv(θ;D)=Ex∼D[max∥r∥≤εDKL(hθ(x+r))]L_{v}(\theta;D)=E_{x\sim D}\left [ \max \limits_{\left \| r \right \| \leq\varepsilon}D_{KL}(h_{\theta}(x+r)) \right ]Lv(θ;D)=Ex∼D[∥r∥≤εmaxDKL(hθ(x+r))]
Lc(θ;Dt)=−Ex∼Dt[hθ(x)⊤lnhθ(x)]L_{c}(\theta;D_{t}) = - E_{x\sim D_{t}}[h_{\theta}(x)^{\top}\ln h_{\theta}(x)]Lc(θ;Dt)=−Ex∼Dt[hθ(x)⊤lnhθ(x)]
总体的模型结构图:
DIRT-T
在一个训练好的VADA网络的基础上,这篇文章设计了一个新的增强方法去提高性能。这个方法只使用target的数据,借鉴了Mean Teacher方法的思想,继续深入贯彻落实聚类假设,即加大聚类中心之间的距离,让数据分布远离分类边界。
这里的DIRT-T方法更像一个two-stages训练方法的第二个stage,这个阶段的损失函数:
minθn.λtLt(θn)+βtE[DKL(hθn−1(x)∥hθn(x))]\min\limits_{\theta_{n}}.\lambda_{t}L_{t}(\theta_{n})+\beta_{t}\mathbb{E}[D_{KL}(h_{\theta_{n-1}}(x)\parallel h_{\theta_{n}}(x))] θnmin.λtLt(θn)+βtE[DKL(hθn−1(x)∥hθn(x))]
最后文章进行了一些测试和Ablation Study,证明了VADA加入的virtual adversarial training部分和DIRT-T增强方法的两个部分都是有效的,但是实验测试的数据集没有大规模数据集,有待进一步的测试。
本人个人博客主页:https://www.frankzhang.tech/
文献下载地址
https://arxiv.org/pdf/1802.08735.pdf
paper report: DIRT-T相关推荐
- KDD 2017 参会报告
本次参会报告由技术发展部黑屏:阿里云飞天一部杰铭.布晓.吴双:阿里妈妈产品技术部永叔.怀人:集团安全部裕宏等同学一起撰写.希望大家积极交流,踊跃发表看法. 一 背景:(杰铭) KDD的全称是ACM S ...
- 人工神经网络实验项目:论文复现
目录 Lab Course Project Lab Project Lab Project Report **Choosen Paper:** [Learning Rich Features for ...
- 中英文论文写作指导第二部分(前言)
目录 1.0 前言的概念和作用 2.0 前言的主要内容 3.0 前言的时态要求 4.0 撰写前言的步骤 4.1 背景资料 4.2 文献回顾 4.3 提出问题 4.4 研究目的 4.5 研究价值 4.6 ...
- UReport2 多报表文件打印,ZIP下载实现
项目中报表较多,客户要求多报表 zip下载或打印,查看ureport内部代码实现,代码相对简单,直接上代码. 实现了多文件混合zip下载,基于浏览器的打印和Lodop打印插件两种方式. Java代码 ...
- WIDER FACE AND PEDESTRIAN CHALLENGE - WIDER CHALLENGE
WIDER FACE AND PEDESTRIAN CHALLENGE - WIDER CHALLENGE http://wider-challenge.org/ CHALLENGE TRACKS W ...
- CVPR 2011 全部论文标题和摘要
CVPR 2011 Tian, Yuandong; Narasimhan, Srinivasa G.; , ■Rectification and 3D reconstruction of curved ...
- Paper:《GPT-4 Technical Report》的翻译与解读
Paper:<GPT-4 Technical Report>的翻译与解读 目录 Paper:<GPT-4 Technical Report>的翻译与解读 Abstract摘要 ...
- 【知乎热议】如何看待swin transformer成为ICCV2021的 best paper?
编辑:深度学习技术前沿 转载请注明来源,谢谢! [导读]今年ICCV2021, 在所有被接收的论文中,来自中国的论文数量占比最高,达到了 43.2%,约为第二位美国(23.6%)的两倍.中国学者凭借S ...
- Paper:《A Few Useful Things to Know About Machine Learning—关于机器学习的一些有用的知识》翻译与解读
Paper:<A Few Useful Things to Know About Machine Learning-关于机器学习的一些有用的知识>翻译与解读 目录 <A Fe ...
- Paper:《First Order Motion Model for Image Animation》翻译与解读
Paper:<First Order Motion Model for Image Animation>翻译与解读 目录 <First Order Motion Model for ...
最新文章
- [ZZ]STM32之RCC
- C语言中printf是不是关键字,C语言中printf是什么意思
- Syn Bot /OSCOVA 上下文(8)
- Flutter React编程范式实践
- GDCM:gdcm::Object的测试程序
- Netty 4.0 新的特性及需要注意的地方
- 计算机维护系统Win8PE,win8如何进入PE重装电脑系统
- js html转为实体,字符串js编码转换成实体html编码的方法(防范XSS攻击)
- java更改reader字体颜色,Java 修改 文件内容 and BufferedReader 乱码问题
- android文件管理器--界面效果二(layout)
- visio2019 专业版,两种方法
- [原]procexp替换任务管理器
- 大学一年级计算机组成语结构试题,一年级下册期末复习习题
- Excel使用技巧之分割字符串
- Ubuntu可视化监控温度
- django之csrf_exempt解决跨域请求的问题
- CANopen协议本质
- 955 不加班公司名单:955.WLB
- crosstool-ng 交叉工具链默认配置 名词解释
- 基于springBoot的记账系统
热门文章
- Netflix Web 性能案例研究
- python求不规则图形面积_使用Python生成不规则形状的图形
- ios微信小程序下拉刷新怎么配_微信小程序之上拉加载与下拉刷新
- PointRCNN: 3D Object Proposal Generation and Detection from Point Cloud【翻译】
- 互联网周刊:草根创业选择题
- web网站添加ico图标
- firefox无法显示flash问题解决
- 计算机辅助翻译工具客户端,OmegaT(计算机辅助翻译软件)
- linux系统忘记密码之破解密码
- 秋天是一个思念的季节