仅分享,侵删  转载 :专知

人工神经网络在解决特定刚性任务的分类问题时,通过不同训练阶段的广义学习行为获取知识。由此产生的网络类似于一个静态的知识实体,努力扩展这种知识而不针对最初的任务,从而导致灾难性的遗忘。

持续学习将这种范式转变为可以在不同任务上持续积累知识的网络,而不需要从头开始再训练。我们关注任务增量分类,即任务按顺序到达,并由清晰的边界划分。我们的主要贡献包括:

(1) 对持续学习技术的分类和广泛的概述;

(2) 一个持续学习器稳定性-可塑性权衡的新框架;

(3) 对11种最先进的持续学习方法和4条基准进行综合实验比较。

考虑到微型Imagenet和大规模不平衡的非自然主义者以及一系列识别数据集,我们以经验的方式在三个基准上仔细检查方法的优缺点。我们研究了模型容量、权重衰减和衰减正则化的影响,以及任务呈现的顺序,并从所需内存、计算时间和存储空间等方面定性比较了各种方法。

引言

近年来,据报道,机器学习模型在个人任务上表现出甚至超过人类水平的表现,如雅达利游戏[1]或物体识别[2]。虽然这些结果令人印象深刻,但它们是在静态模型无法适应其行为的情况下获得的。因此,这需要在每次有新数据可用时重新启动训练过程。在我们的动态世界中,这种做法对于数据流来说很快就变得难以处理,或者可能由于存储限制或隐私问题而只能暂时可用。这就需要不断适应和不断学习的系统。人类的认知就是这样一个系统的例证,它具有顺序学习概念的倾向。通过观察例子来重新审视旧的概念可能会发生,但对保存这些知识来说并不是必要的,而且尽管人类可能会逐渐忘记旧的信息,但完全丢失以前的知识很少被证明是[3]。相比之下,人工神经网络则不能以这种方式学习:在学习新概念时,它们会遭遇对旧概念的灾难性遗忘。为了规避这一问题,人工神经网络的研究主要集中在静态任务上,通常通过重组数据来确保i.i.d.条件,并通过在多个时期重新访问训练数据来大幅提高性能。

持续学习研究从无穷无尽的数据流中学习的问题,其目标是逐步扩展已获得的知识,并将其用于未来[4]的学习。数据可以来自于变化的输入域(例如,不同的成像条件),也可以与不同的任务相关联(例如,细粒度的分类问题)。持续学习也被称为终身学习[18]0,[18]1,[18]2,[18]3,[18]5,[18]4,顺序学习[10],[11],[12]或增量学习[13],[14],[15],[16],[17],[18],[19]。主要的标准是学习过程的顺序性质,只有一小部分输入数据来自一个或几个任务,一次可用。主要的挑战是在不发生灾难性遗忘的情况下进行学习:当添加新的任务或域时,之前学习的任务或域的性能不会随着时间的推移而显著下降。这是神经网络中一个更普遍的问题[20]的直接结果,即稳定性-可塑性困境,可塑性指的是整合新知识的能力,以及在编码时保持原有知识的稳定性。这是一个具有挑战性的问题,不断学习的进展使得现实世界的应用开始出现[21]、[22]、[23]。

为了集中注意力,我们用两种方式限制了我们的研究范围。首先,我们只考虑任务增量设置,其中数据按顺序分批到达,一个批对应一个任务,例如要学习的一组新类别。换句话说,我们假设对于一个给定的任务,所有的数据都可以同时用于离线训练。这使得对所有训练数据进行多个时期的学习成为可能,反复洗刷以确保i.i.d.的条件。重要的是,无法访问以前或将来任务的数据。在此设置中优化新任务将导致灾难性的遗忘,旧任务的性能将显著下降,除非采取特殊措施。这些措施在不同情况下的有效性,正是本文所要探讨的。此外,任务增量学习将范围限制为一个多头配置,每个任务都有一个独占的输出层或头。这与所有任务共享一个头的更有挑战性的类增量设置相反。这在学习中引入了额外的干扰,增加了可供选择的输出节点的数量。相反,我们假设已知一个给定的样本属于哪个任务。

其次,我们只关注分类问题,因为分类可以说是人工神经网络最既定的任务之一,使用相对简单、标准和易于理解的网络体系结构具有良好的性能。第2节对设置进行了更详细的描述,第7节讨论了处理更一般设置的开放问题。

---------♥---------

猜您喜欢:

等你着陆!【GAN生成对抗网络】知识星球!

超100篇!CVPR 2020最全GAN论文梳理汇总!

附下载 | 《Python进阶》中文版

附下载 | 经典《Think Python》中文版

附下载 | 《Pytorch模型训练实用教程》

附下载 | 最新2020李沐《动手学深度学习》

附下载 | 《可解释的机器学习》中文版

附下载 |《TensorFlow 2.0 深度学习算法实战》

附下载 | 超100篇!CVPR 2020最全GAN论文梳理汇总!

附下载 |《计算机视觉中的数学方法》分享

综述 | 持续学习,如何解决分类问题中灾难性遗忘相关推荐

  1. 【深度学习】解决物体检测中的小目标问题

    为了提高模型在小物体上的性能,我们建议使用以下技术: 提高图像捕获分辨率 提高模型的输入分辨率 平铺图像 通过扩充生成更多数据 自动学习模型锚 过滤掉多余的类 为什么小目标问题很难? 小物体问题困扰着 ...

  2. 深度学习之灾难性遗忘问题

    深度学习之灾难性遗忘问题 健忘是一种病态,善忘是一种智慧. --写在前面 文章目录 深度学习之灾难性遗忘问题 1. 背景 2. What and Why 灾难性遗忘 首先回答第一个W: 什么是灾难性遗 ...

  3. 怎样缓解灾难性遗忘?持续学习最新综述三篇

    本文转载自公众号"夕小瑶的卖萌屋",专业带逛互联网算法圈的神操作 ----->我是传送门 关注后,回复以下口令: 回复[789] :领取深度学习全栈手册(含NLP.CV海量综 ...

  4. 持续学习研究过程Continural Learning Study

    本篇文章为研究索引 前言:持续学习主要是,神经网络中为解决灾难性遗忘问题的算法研究. 灾难性遗忘:随着增量学习过程中分类模型的迭代,神经网络会对不同的任务作出分类预测,如果用新的机制去预测分类的时候, ...

  5. 机器人操作持续学习论文(1)原文阅读与翻译——机器人操作中无灾难性遗忘的原语生成策略学习

    Primitives Generation Policy Learning without Catastrophic Forgetting for Robotic Manipulation 1机器人操 ...

  6. 如何赋予自主系统具备持续学习的能力?

    作为人工智能浪潮中最为突出的贡献之一,深度神经网络在固定任务的表现已经得到了广泛的认可,针对特定应用场景的优化部署也在急速增长.深度网络是一个静态的知识实体,但是在扩展此知识容量的过程中通常会导致已学 ...

  7. NeurIPS 2021 | 通过寻找平坦最小值,克服小样本增量学习中的灾难性遗忘

    ©作者 | FlyingBug 单位 | 哈尔滨工业大学(深圳) 研究方向 | 小样本学习 写在篇首 本文分享的这篇论文是 NeurIPS 2021的一篇 Few-Shot 增量学习 (FSCIL) ...

  8. DeepMind发布最新《神经网络中持续学习》综述论文!

    来源:AI科技评论 本文约3200字,建议阅读6分钟 本文重点介绍一些神经网络中最有前途和最有影响力的方向. 在过去的几十年中,人工智能研究取得了巨大进展,但是它主要依赖于固定的数据集和固定的环境. ...

  9. DeepMind发布《神经网络中持续学习》Cell综述论文

    点上方计算机视觉联盟获取更多干货 仅作学术分享,不代表本公众号立场,侵权联系删除 转载于:专知 AI博士笔记系列推荐 周志华<机器学习>手推笔记正式开源!可打印版本附pdf下载链接 现代机 ...

最新文章

  1. Linux(CentOS 7_x64位)系统下安装ACPYPE
  2. 如何解决ORA-12547错误!
  3. linux系统编程:线程原语
  4. 恢复mysql中root用户的所有权限_如何还原MySQL root用户的全部权限
  5. 【英语学习】【WOTD】cerebral 释义/词源/示例
  6. Codeforces Round #223 (Div. 2): C. Sereja and Prefixes(二分+递归)
  7. 2021安徽高考成绩及录取结婚查询,2020安徽高考录取结果查询时间及通知书发放时间...
  8. 在PhpStorm9中与Pi的xdebug进行调试
  9. Copula函数理论及实现(三维)-MATLAB
  10. 从nexus下载所有jar包方法 迁移到其他nexus中
  11. 计算机二级文化基础知识,全国计算机二级office考试内容
  12. 计算机科学中的张量,杨晓伟教授到我院做“张量学习的几个关键问题”学术报告...
  13. 放大镜css图标,CSS放大镜的制作
  14. HTML龙卷风特效代码
  15. 86版五笔单字效率分析
  16. mac --- wifi无法获取ip地址
  17. 前后端分离的文件上传,上传zip或者rar压缩包(vue+springboot)。
  18. 微信点餐小程序开发_分享微信点餐小程序可以实现哪些功能
  19. Hadoop垃圾回收站与YARN日志聚合
  20. 条件概率、全概率、先验概率、后验概率

热门文章

  1. 关于使用freemarker制作word模板经历的一些问题
  2. 数据分析-各种图表的使用场景(网易云课堂笔记)
  3. 【笔记】python的while循环简介:使用while循环、让用户选择何时退出、使用标志、使用break退出循环、在循环中使用continue、避免无限循环
  4. SuperMap杯全国高校GIS大赛-移动应用组学习资料
  5. velocity官网介绍
  6. ios 关于navigationController导航栏隐藏问题
  7. 玩转AndroidStudioIDE
  8. 组合数的求解(打表,逆元,Lucas 定理,大整数求解)
  9. PHP学习笔记——环境安装/基础知识
  10. 基于移动应用的城市公共气象服务平台的设计与实现