项目 内容
论文名 Mean teachers are better role models:Weight-averaged consistency targets improvesemi-supervised deep learning results
作者 Antti Tarvainen,Harri Valpola
主要内容 提出对Temporal Ensembling的改进方法,对模型的权重进行平均,而不是对预测标签进行平均
发表时间 2017年

Abstract

Temporal Ensembling对每个训练样本的预测标签进行指数滑动平均(EMA),并惩罚与这个目标不一致的预测,得到了SOTA的结果。但是目标每一代仅改变一次,当学习较大的数据集时Temporal Ensembling变得笨拙。

作者提出Mean Teacher方法来解决上述问题。Mean Teacher方法对模型的权重而不是预测标签进行平均,获得了准确性的提升。

Introduction

深度学习模型需要大量的参数去学习有用的特征抽象,这使得他们容易产生过拟合。然而,手工添加高质量标签的成本是非常高的。因此,需要在半监督学习中使用正则化方法有效利用未标记的数据去减小过拟合效应。

当一个被感知的对象轻微改变,人类依然能够认为它是同样的对象。所以分类模型应该能够对相似数据点有一致的输出。正则化方法就是在为了在输入数据上添加噪声,使模型学习到这种不变性。

因为无标签样本的分类损失无法定义,噪声本身的正则化在半监督学习中不能提供帮助。为了克服这个问题,Γ\GammaΓ模型对每个数据点包含噪声和不包含噪声的情况进行评估,在它们之间应用了一个一致性损失(consistency cost)。模型假定了一对角色:老师和学生。学生像以前一样学习;老师生成标签,并将这些标签用于学生的训练。由于标签是模型自己生成的,所以它有很大可能是不对的,这就影响模型提升精度,需要通过提升标签的质量来优化。

有至少两种方法提升标签的质量。一种是更精心的选择表示的扰动,而不是仅仅使用加性和乘性噪声。另一种方法是更精心的选择教师模型,而不是仅仅复制学生模型。对于第一种方法,有人已经提出了Virtual Adversarial Training。作者研究第二种方法,作者表示这两种方法并不冲突,是可以结合的,但是不在该论文的讨论范围之内。

Π\PiΠ model在推理时对模型加入噪声,减轻了模型对无标签数据产生错误预测标签的情况,一个加入了噪声的教师模型可以产生更精确的目标。

Π\PiΠ model的升级版是Temporal Ensembling,它对每一个训练样本维持了一个指数滑动平均。每个训练步骤,这个批次中样本的EMA预测值将通过新的预测值更新。但每个目标在每一代只被更新一次,更新速度较慢。并且越大的数据集,更新越慢。

Mean Teacher的具体实现方法

作者提出对模型的权重而不是预测值进行平均来克服Temporal Ensembling的局限性,这样就可以在每一个训练步骤之后对学习到的信息进行整合,而不是在每一代之后。并且,因为权重平均改进了每一层的输出,而不仅仅是最高层的输出,所以最终的模型有着更好的中间层表示。

比起Temporal Ensembling,Mean Teacher的改变带来了两个优点:第一,越准确的目标标签使得学生和教师模型之间的反馈环循环更快,可获得更好的测试准确性;第二,方法可以被用在大数据集和在线学习中去。

一致性损失(consistency cost)JJJ 被定义为学生模型的预测(包含权重θ\thetaθ和噪声η\etaη)和教师模型的预测(包含权重θ′\theta'θ′和噪声η′\eta'η′)之间的期望距离(这里作者使用的是均方误差MSE)。

Π\PiΠ model、Temporal Ensembling和Mean Teacher之间的不同就在于教师预测的生成方法。Π\PiΠ model使用θ′=θ\theta'=\thetaθ′=θ,即教师模型完全复制学生模型;Temporal Ensembling使用对连续的每一代预测值的加权平均来近似f(x,θ′,η′)f(x,\theta',\eta')f(x,θ′,η′);作者定义θt′\theta_t'θt′​来表示第ttt个训练步骤的权重,它是连续的每一代的θ\thetaθ权重的指数滑动平均(EMA)

这里的α\alphaα是一个超参数‘平滑系数’。
另外一点不同是,Π\PiΠ model会对θ′\theta'θ′进行训练,而Temporal Ensembling和Mean Teacher会在优化时把它视为常数。


Mean Teacher的整体框架如下图所示:

对一幅有标记的输入图像来说,它会分别被送入学生模型和教师模型中去,两个模型会分别对输入图像添加噪声η\etaη和η′\eta'η′。学生模型的输出会与真实的标签一起计算分类损失,并与教师模型的输出一起计算一致性损失,最后将这两部分损失通过加权和合并在一起。之后通过梯度下降法更新学生模型,通过EMA来更新教师模型。

对于无标记的样本来说,整个过程是类似的,唯一不同在于无标记样本的训练过程没有分类损失。

MeanTeacher论文学习笔记相关推荐

  1. 动态环境下的SLAM:DynaSLAM 论文学习笔记

    动态环境下的SLAM:DynaSLAM 论文学习笔记 这篇文章 论文摘要 系统流程 相关环节的实现方法 神经网络检测图中动态物体(Mask R-CNN) Low-Cost Tracking 使用多视图 ...

  2. 识别和追踪主题层次的影响力者(来自2018 Machine Learning 论文学习笔记)

    本文作者:合肥工业大学 管理学院 钱洋 email:1563178220@qq.com . 以下内容是个人的论文阅读笔记,内容可能有不到之处,欢迎交流. 未经本人允许禁止转载. 文章目录 论文来源 论 ...

  3. 论文学习笔记 POSEIDON: Privacy-Preserving Federated Neural Network Learning

    论文学习笔记 POSEIDON: Privacy-Preserving Federated Neural Network Learning NDSS 2021录用文章 目录 论文学习笔记 POSEID ...

  4. 【论文学习笔记-2】高分辨率3D深度重建

    [论文学习笔记-2] 高分辨率3D深度重建 背景介绍 模型 目标 Related Works 背景介绍 应用场景广泛:桥,电缆etc 高分辨率图像的特点:像素多,potential disparity ...

  5. Dual Graph Attention Networks for Deep Latent Representation of Multifaceted Social...》论文学习笔记

    Dual Graph Attention Networks for Deep Latent Representation of Multifaceted Social Effects in Recom ...

  6. 论文学习笔记: Learning Multi-Scale Photo Exposure Correction(含pytorch代码复现)

    论文学习笔记: Learning Multi-Scale Photo Exposure Correction--含pytorch代码复现 本章工作: 论文摘要 训练数据集 网络设计原理 补充知识:拉普 ...

  7. 网规第二版:第8章 网络规划与设计论文学习笔记(含历年真题)(完结)

    第8章 网络规划与设计论文学习笔记 8.1写作范围要求 1.网络技术应用与对比分析 2.网络技术对应用系统建设的影响 3.专用网络需求分析.设计.实施和项目管理 4.下一代网络技术分析 8.2论文考试 ...

  8. 论文学习笔记 MUSE: Secure Inference Resilient to Malicious Clients

    论文学习笔记 MUSE: Secure Inference Resilient to Malicious Clients 一.背景介绍-神经网络推理 二.在半诚实模型下的模型提取攻击 2.1 模型结构 ...

  9. 论文学习笔记 SIMC: ML Inference Secure Against Malicious Clients at Semi-Honest Cost

    论文学习笔记 SIMC: ML Inference Secure Against Malicious Clients at Semi-Honest Cost 一.安全神经网络推理 二.论文主要思想 三 ...

  10. 【论文学习笔记-10】ActiveStereoNet(Google ECCV2018)主动式双目相机自监督学习立体匹配网络

    [论文学习笔记-10]ActiveStereoNet(Google ECCV2018)主动式双目相机自监督学习立体匹配网络) 自监督训练方法 Experiment ORAL 针对双目立体匹配中无监督存 ...

最新文章

  1. 北京智源大会 | AI 产业下个十年中的大变量
  2. CTFshow php特性 web129
  3. c语言删除s字符串中所有子串t,从串s中删除所有和串t相同的子串的算法
  4. 波卡链Substrate (7)Grandpa协议一“概念说明”
  5. SQL Server2008存储结构之聚集索引
  6. 未来集市广告_为什么广告的未来是开放的
  7. C#中的@符号的使用
  8. 使用dom4j来解析相关的xml字符串
  9. hdu3729(二分图)
  10. PySpark︱DataFrame操作指南:增/删/改/查/合并/统计与数据处理
  11. 关于浮动-float
  12. adb小天才_ADB工具包2020年最新版下载-支持解锁新机BL调试ROOT等各种操作
  13. h5禁用浏览器下载视频_h5中利用canvas绘制video 忽略浏览器自带视频播放控件
  14. dicom 脱敏_一种对医疗影像数据进行脱敏处理的方法及系统与流程
  15. 人工智能换脸技术python_人工智能几行代码实现换脸,python+dlib实现图文教程
  16. 搜索引擎最经典的书籍——《走进搜索引擎》(梁斌 著)百度网盘免费下载
  17. Windows 2003访问https失败
  18. android 储存方案,Android本地数据存储方案(一)
  19. 编译PHP的windows版本
  20. HeidiSQL日常使用

热门文章

  1. 七日杀服务器怎么设置家的位置,七日杀固定地图在哪儿建家好 | 手游网游页游攻略大全...
  2. java 发送邮件demo_java邮件发送Demo(完整例子)
  3. html学习——介绍
  4. Android Studio 设置控件边框
  5. 自定义Msgbox密码登录
  6. GitHub学生优惠:repl.it 使用--Python爬虫示例
  7. 求两个单链表的差集和并集
  8. 人物摄影中的基本取景法 特写和大特写
  9. 【Trailhead题目解析】Prepare your salesforce org for users - 1Set Up the Exchange Rate
  10. c语言单片机实时闹钟,基于单片机的智能定时闹钟的设计