综述 | 持续学习，如何解决分类问题中灾难性遗忘

仅分享，侵删转载：专知

人工神经网络在解决特定刚性任务的分类问题时，通过不同训练阶段的广义学习行为获取知识。由此产生的网络类似于一个静态的知识实体，努力扩展这种知识而不针对最初的任务，从而导致灾难性的遗忘。

持续学习将这种范式转变为可以在不同任务上持续积累知识的网络，而不需要从头开始再训练。我们关注任务增量分类，即任务按顺序到达，并由清晰的边界划分。我们的主要贡献包括:

(1) 对持续学习技术的分类和广泛的概述;

(2) 一个持续学习器稳定性-可塑性权衡的新框架;

(3) 对11种最先进的持续学习方法和4条基准进行综合实验比较。

考虑到微型Imagenet和大规模不平衡的非自然主义者以及一系列识别数据集，我们以经验的方式在三个基准上仔细检查方法的优缺点。我们研究了模型容量、权重衰减和衰减正则化的影响，以及任务呈现的顺序，并从所需内存、计算时间和存储空间等方面定性比较了各种方法。

引言

近年来，据报道，机器学习模型在个人任务上表现出甚至超过人类水平的表现，如雅达利游戏[1]或物体识别[2]。虽然这些结果令人印象深刻，但它们是在静态模型无法适应其行为的情况下获得的。因此，这需要在每次有新数据可用时重新启动训练过程。在我们的动态世界中，这种做法对于数据流来说很快就变得难以处理，或者可能由于存储限制或隐私问题而只能暂时可用。这就需要不断适应和不断学习的系统。人类的认知就是这样一个系统的例证，它具有顺序学习概念的倾向。通过观察例子来重新审视旧的概念可能会发生，但对保存这些知识来说并不是必要的，而且尽管人类可能会逐渐忘记旧的信息，但完全丢失以前的知识很少被证明是[3]。相比之下，人工神经网络则不能以这种方式学习:在学习新概念时，它们会遭遇对旧概念的灾难性遗忘。为了规避这一问题，人工神经网络的研究主要集中在静态任务上，通常通过重组数据来确保i.i.d.条件，并通过在多个时期重新访问训练数据来大幅提高性能。

持续学习研究从无穷无尽的数据流中学习的问题，其目标是逐步扩展已获得的知识，并将其用于未来[4]的学习。数据可以来自于变化的输入域(例如，不同的成像条件)，也可以与不同的任务相关联(例如，细粒度的分类问题)。持续学习也被称为终身学习[18]0，[18]1，[18]2，[18]3，[18]5，[18]4，顺序学习[10]，[11]，[12]或增量学习[13]，[14]，[15]，[16]，[17]，[18]，[19]。主要的标准是学习过程的顺序性质，只有一小部分输入数据来自一个或几个任务，一次可用。主要的挑战是在不发生灾难性遗忘的情况下进行学习:当添加新的任务或域时，之前学习的任务或域的性能不会随着时间的推移而显著下降。这是神经网络中一个更普遍的问题[20]的直接结果，即稳定性-可塑性困境，可塑性指的是整合新知识的能力，以及在编码时保持原有知识的稳定性。这是一个具有挑战性的问题，不断学习的进展使得现实世界的应用开始出现[21]、[22]、[23]。

为了集中注意力，我们用两种方式限制了我们的研究范围。首先，我们只考虑任务增量设置，其中数据按顺序分批到达，一个批对应一个任务，例如要学习的一组新类别。换句话说，我们假设对于一个给定的任务，所有的数据都可以同时用于离线训练。这使得对所有训练数据进行多个时期的学习成为可能，反复洗刷以确保i.i.d.的条件。重要的是，无法访问以前或将来任务的数据。在此设置中优化新任务将导致灾难性的遗忘，旧任务的性能将显著下降，除非采取特殊措施。这些措施在不同情况下的有效性，正是本文所要探讨的。此外，任务增量学习将范围限制为一个多头配置，每个任务都有一个独占的输出层或头。这与所有任务共享一个头的更有挑战性的类增量设置相反。这在学习中引入了额外的干扰，增加了可供选择的输出节点的数量。相反，我们假设已知一个给定的样本属于哪个任务。

其次，我们只关注分类问题，因为分类可以说是人工神经网络最既定的任务之一，使用相对简单、标准和易于理解的网络体系结构具有良好的性能。第2节对设置进行了更详细的描述，第7节讨论了处理更一般设置的开放问题。

---------♥---------

猜您喜欢：

等你着陆！【GAN生成对抗网络】知识星球！

超100篇！CVPR 2020最全GAN论文梳理汇总！

附下载 | 《Python进阶》中文版

附下载 | 经典《Think Python》中文版

附下载 | 《Pytorch模型训练实用教程》

附下载 | 最新2020李沐《动手学深度学习》

附下载 | 《可解释的机器学习》中文版

附下载 |《TensorFlow 2.0 深度学习算法实战》

附下载 | 超100篇！CVPR 2020最全GAN论文梳理汇总！

附下载 |《计算机视觉中的数学方法》分享

综述 | 持续学习，如何解决分类问题中灾难性遗忘相关推荐

【深度学习】解决物体检测中的小目标问题
为了提高模型在小物体上的性能,我们建议使用以下技术: 提高图像捕获分辨率提高模型的输入分辨率平铺图像通过扩充生成更多数据自动学习模型锚过滤掉多余的类为什么小目标问题很难? 小物体问题困扰着 ...
深度学习之灾难性遗忘问题
深度学习之灾难性遗忘问题健忘是一种病态,善忘是一种智慧. --写在前面文章目录深度学习之灾难性遗忘问题 1. 背景 2. What and Why 灾难性遗忘首先回答第一个W: 什么是灾难性遗 ...
怎样缓解灾难性遗忘？持续学习最新综述三篇
本文转载自公众号"夕小瑶的卖萌屋",专业带逛互联网算法圈的神操作 ----->我是传送门关注后,回复以下口令: 回复[789] :领取深度学习全栈手册(含NLP.CV海量综 ...
持续学习研究过程Continural Learning Study
本篇文章为研究索引前言:持续学习主要是,神经网络中为解决灾难性遗忘问题的算法研究. 灾难性遗忘:随着增量学习过程中分类模型的迭代,神经网络会对不同的任务作出分类预测,如果用新的机制去预测分类的时候, ...
机器人操作持续学习论文（1）原文阅读与翻译——机器人操作中无灾难性遗忘的原语生成策略学习
Primitives Generation Policy Learning without Catastrophic Forgetting for Robotic Manipulation 1机器人操 ...
如何赋予自主系统具备持续学习的能力？
作为人工智能浪潮中最为突出的贡献之一,深度神经网络在固定任务的表现已经得到了广泛的认可,针对特定应用场景的优化部署也在急速增长.深度网络是一个静态的知识实体,但是在扩展此知识容量的过程中通常会导致已学 ...
NeurIPS 2021 | 通过寻找平坦最小值，克服小样本增量学习中的灾难性遗忘
©作者 | FlyingBug 单位 | 哈尔滨工业大学(深圳) 研究方向 | 小样本学习写在篇首本文分享的这篇论文是 NeurIPS 2021的一篇 Few-Shot 增量学习 (FSCIL) ...
DeepMind发布最新《神经网络中持续学习》综述论文！
来源:AI科技评论本文约3200字,建议阅读6分钟本文重点介绍一些神经网络中最有前途和最有影响力的方向. 在过去的几十年中,人工智能研究取得了巨大进展,但是它主要依赖于固定的数据集和固定的环境. ...
DeepMind发布《神经网络中持续学习》Cell综述论文
点上方计算机视觉联盟获取更多干货仅作学术分享,不代表本公众号立场,侵权联系删除转载于:专知 AI博士笔记系列推荐周志华<机器学习>手推笔记正式开源!可打印版本附pdf下载链接现代机 ...

综述 | 持续学习，如何解决分类问题中灾难性遗忘

综述 | 持续学习，如何解决分类问题中灾难性遗忘相关推荐

最新文章

热门文章