【论文阅读-TPAMI2021】Curriculum Learning(课程学习)综述
简介
Curriculum learning (CL,课程学习)是一种模型训练策略,通过先让模型学习简单数据后再学习困难数据的方式模拟学生进行课程学习的场景。通用的课程学习框架为Difficulty Measurer (困难程度评估)+ Training Scheduler(训练计划) 两部分,具体也可将课程学习方法分为如下几种策略:Self-paced Learning, Transfer Teacher, RL Teacher, and Other Automatic CL。
下图展示了课程学习的基本思路,先学习简单数据再学习复杂数据:
论文链接:https://arxiv.org/abs/2010.13166
CL具体思路
下图展示了CL具体方法的分类:
可以看出,这篇文章首先将CL的方法分为了预定义的CL和自动化的CL。在预定义的CL中,需要开发者手动评估样本学习的困难程度,然后根据困难程度将样本排序后进行训练。而自动的CL可以在模型的训练过程中动态的评估样本学习困难程度,然后调整模型训练时的输入。
预定义的CL
正如上面所说,CL的框架包含了Difficulty Measurers和Training Schedulers两部分。预定义的CL要求开发人员手动定义上述这两部分后进行训练。
常见的预定义Difficulty Measurer
根据具体任务的特点可以定义出不同的Difficulty Measurer,下图展示了常见的Difficulty Measurer:
常见的预定义Training Scheduler
通常情况下,Training Schedulers可以分为离散(discrete)和连续(continuous)两种类型。离散的情况下模型会在收敛于某个数据子集或在数据子集上训练固定数量的epoch后调整训练数据子集。连续的情况下,模型会在每个epoch后调整训练数据子集。
离散的Training Scheduler经典方法-Baby Step如下:
相比较于在模型收敛后再加入新数据的离散策略,连续Training Scheduler数据增加方式更加平滑,下图展示了不同策略在不同epoch的训练数据变化情况
自动化的CL
预定义CL和自动化CL对比
不同自动化CL之间的对比
Self-paced Learning (SPL,自我学习)
学生通过自己定制课程进行迭代学习,SPL通常采用模型每个样本训练的loss作为衡量该样本学习困难程度的标准。SPL的主要优点为:SPL是一种基于loss的半自动化CL,将课程设计嵌入到原始机器学习任务的学习目标中,增加了方法的灵活性和对不同任务的适用性。
Transfer Teacher (老师教学)
引入额外的数据集,训练一个Teacher模型。迁移已经训练好的模型来评估的样本的困难程度,可以避免未充分训练的模型评估时的风险。
下面是常见的Transfer Teacher :
RL Teacher (强化学习老师)
SPL和Transfer Teacher 均使得Difficulty Measurer自动化了,但Training Scheduler还是用预定义的。在人类教学中,教学的策略会同时考虑老师和同学,学生给老师反馈,老师也要基于此调整教学策略。基于此,RL Teacher的方法中包含了学生模型和基于强化学习的老师模型,在每一个epoch的训练策略中,RL teacher会根据学生反馈动态选择训练数据。数据选择作为RL的action,学生反馈作为state和reward。
下面展示了CL常用的强化学习方法:
Other Automatic CL (其他自动化CL)
除了RL Teacher之外,还有一些全自动的CL方法。只管而言,这些设计应该要求课程的生成仅依赖于数据集、学生模型和任务目标。可以将课程视为一系列训练标准或目标,因此,从优化的角度来看,在每个训练epoch,我们希望优化以下映射以提高性能:{数据,学生模型的当前状态,任务目标}→ 训练目标。下面展示一些示例:
CL和其他数据相关ML概念的区别
传统机器学习:利用训练集训练出模型,利用测试集测试模型性能。
迁移学习:首先在多个相关任务上训练模型,然后将模型能力迁移到 T n + 1 T_{n+1} Tn+1个任务中,最后在第 T n + 1 T_{n+1} Tn+1个任务上测试模型性能。
多任务学习:同时在多个任务上进行训练,然后在多个测试集的进行训练。
元学习:在多个任务中学习通用的元知识(common meta-knowledge),然后在不同目标任务上继续学习并更新模型,最后在目标任务测试集上进行测试。
持续学习:通过更新一个训练好的模型来克服遗忘,从而缓解在线任务序列之间的差异。
主动学习:主动学习者通过生成查询来要求专家对几个未标记的实例进行标注以进行进一步训练,从而在较少标记数据的情况下实现了良好的性能。
课程学习:通过一系列重新加权来消除测试分布和训练分布之间的差异,从而导致朝着目标逐步优化的过程。
【论文阅读-TPAMI2021】Curriculum Learning(课程学习)综述相关推荐
- TPAMI 2021 | 清华大学朱文武团队:首篇课程学习综述
©作者 | 机器之心编辑部 来源 | 机器之心 来自清华大学的研究者王鑫.陈禹东.朱文武撰写了一篇名为<A Survey on Curriculum Learning>的课程学习综述论文, ...
- 论文阅读:Deep Learning in Mobile and Wireless Networking:A Survey
论文阅读:Deep Learning in Mobile and Wireless Networking:A Survey 从背景介绍到未来挑战,一文综述移动和无线网络深度学习研究 近来移动通信和 5 ...
- 《论文阅读》Multi-Task Learning of Generation and Classification for Emotion-Aware Dialogue Response Gener
<论文阅读>Multi-Task Learning of Generation and Classification for Emotion-Aware Dialogue Response ...
- 论文阅读 [CVPR-2022] BatchFormer: Learning to Explore Sample Relationships for Robust Representation Lea
论文阅读 [CVPR-2022] BatchFormer: Learning to Explore Sample Relationships for Robust Representation Lea ...
- 论文阅读 [TPAMI-2022] On Learning Disentangled Representations for Gait Recognition
论文阅读 [TPAMI-2022] On Learning Disentangled Representations for Gait Recognition 论文搜索(studyai.com) 搜索 ...
- 【论文阅读】Cross-X Learning for Fine-Grained Visual Categorization
[论文阅读]Cross-X Learning for Fine-Grained Visual Categorization 摘要 具体实现 OSME模块 跨类别跨语义正则化(C3SC^{3} SC3S ...
- 论文阅读|DeepWalk: Online Learning of Social Representations
论文阅读|DeepWalk: Online Learning of Social Representations 文章目录 论文阅读|DeepWalk: Online Learning of Soci ...
- 【论文翻译】点云深度学习综述 -- Deep Learning for 3D Point Clouds: A Survey
论文链接:Deep Learning for 3D Point Clouds: A Survey 文章目录 摘要 1. 介绍 2. 三维形状分类 2.1 基于投影的网络 2.1.1 多视图表示 2.1 ...
- [论文阅读笔记58]Learning from Noisy Labels with Deep Neural Networks:A Survey
1.题目 Learning from Noisy Labels with Deep Neural Networks: A Survey 作者团队:韩国科学技术院(KAIST) Song H , Kim ...
最新文章
- Centos7 上配置 java JDK1.8
- 学校工作必备ASP程序
- python windows安装readline
- php生成临时文件,使用PHP处理内存中的存档(无需在磁盘上创建临时文件)
- Ajax中GET和POST的区别
- Keeplived配置Nginx双机高可用【转】
- mysql 数据库导出全部数据到excel,并保存为不同的sheet
- 【Flink】Flink 实现 AT_LEAST_ONCE EXACTLY_ONCE 案例
- html 移动app开发
- OpenGl文章 Android OpenGL ES 简明开发教程
- 使用mysql悲观锁解决并发问题
- 理解iOS 8中的Self Sizing Cells和Dynamic Type
- Android 压缩解压zip文件
- 通达OA CRM扫描枪条码录入
- 学生网页设计作业源码 HTML+CSS 网上书店网站设计与实现
- 不管是蓝牙耳机还是有线耳机长时间佩戴都是有危害的,这些问题不容小觑!
- system占用cpu过高
- Java视频在线观看网址
- TensorFlow 核心流程剖析 -- 2 神经网络模型的构建、分割和优化
- python列表逐个输出_python的列表元素输出