作者 | 李芬

审稿 | 涂心琪

本期介绍在斯坦福大学Jure Leskovec教授课题组于2020年7月发表的一篇论文“Concept Learners for Generalizable Few-Shot Learning”。人类认知的核心在于结构化的、可重用的概念,而目前存在的元学习方法无法给已学习的表示添加结构化概念,只能通过已标记的任务来学习新的表示,针对这一问题,作者提出了一种元学习方法——COMET。该方法尝试沿着人类可解释的概念维度学习新的表示以提高模型泛化能力,它能够学习高层概念到半结构化度量空间的映射,并有效地结合概念学习的输出。

1

概述

近年来,深度学习在许多领域取得了优秀的成果,但深度学习需要大规模标注训练数据,在缺乏训练数据时,模型往往过度拟合或过于简单,泛化能力较差。而人类却可以借鉴先前的知识和经验,非常迅速地学习新概念。为了解决这一问题,许多学术研究者致力于设计出一个能够在只给出几个标记的训练样本的情况下对新任务进行泛化的算法。

元学习在小样本学习的领域取得了重大进展。然而,最近的一项工作表明,简单基线方法的性能与现有的元学习方法相当,这就引出了另一个问题,即哪些组件对于快速适应和泛化至关重要。人类知识是以可重用概念的形式构建的,在学习辨别一个新的东西的时候,我们已经具备了一些关键概念,然后将重点放在这些特定的概念上,并把它们结合起来识别一个新的东西。当机器具有这种结构化的认知时,就能提高元学习的泛化能力。

受人类认知的结构化形式的启发,文章提出了一种元学习方法——COMET,它能够沿着人类可解释的概念维度进行学习。三个关键方面使得COMET方法具有很强的泛化能力:(1)半结构化表示学习,(2)用概念原型描述的特定于概念的度量空间,以及(3)对多个模型的集成,提高了基础学习的概括能力。这些高级概念可以以完全无监督的方式发现,或者使用外部知识库来定义,并且允许这些概念具有许多噪声。模型可以通过分配局部和全局概念重要性分数来学习这些概念中的哪些子集是重要的。COMET是第一个与领域无关的可解释元学习方法,其工作原理如图1所示:

图1 COMET模型识别新鸟类物种原理

2

模型简介及实验

从图1中可以知道,在每个概念维度上,COMET都使用独立的概念学习器来学习概念嵌入,并将其与概念原型进行比较。然后,COMET有效地汇总概念维度上的信息,为每个维度分配概念重要性分数。为了证明该方法在不同的领域都能发挥很好的作用,该文章使用了计算机视觉和生物学两个领域的数据集来评估模型的性能。

2.1 模型

在少样本分类中,将带标签的训练集定义为Dtr、无标签的测试集定义为Dqr和少量带标签的验证集定义为S。同深度学习数据集一样,每个被标注的数据点{x,y}都是由D维的特征向量x∈RD和分类标签y∈{1,...,K}组成,其中 {Ytr} ∩ {Yqr} = Ø, {YS} = {Yqr}。

元学习的训练通常是使用小批次采样episodes来执行的。每个首先对训练集中的类进行采样,然后对标有这些类的数据点进行采样,从而得到每个episode。这些采样数据点被分成验证集和测试集。这个元学习通过试图模拟测试期间遇到的低数据维度来提高模型的通用性。

本文的模型是在原型网络的基础上进行改进的。原型网络是一种简单且高效的基于度量的元学习方法,它是由卷积神经网络参数化的非线性嵌入函数。其主要思想是学习一个函数fθ,使得在M维嵌入空间中,数据点聚集在每个类k的单个原型表示pk∈RM周围。

文章主要假设输入维度可以分为几个相关维度的子集,这些相关维度用于指导训练高级的、人类可解释的概念。这种潜在的重叠、噪声和不完整的人类可解释维度集合存在于许多现实世界场景中。这些概念可以被视为输入的基本部分的表示,反映了人类对世界进行推理的方式。这些概念是有噪声的、不完整的、重叠的或冗余的,但它们仍然为元学习算法提供有用的指导。

COMET不是学习所有维度上的单个映射函数fθ,而是将原始空间分成预定义概念的子空间,并针对每个概念j学习单独的嵌入函数fθ(J)。概念嵌入函数fθ(J)对应图1中的concept learners,是由深度神经网络参数化的非线性函数。给定一个数据点xq,计算它的概念嵌入,并估计它到每个类的概念原型的距离。然后,通过对概念嵌入和概念原型之间的距离求和来聚合所有概念上的信息。

2.2 实验

作者用两个完全不同的领域:计算机视觉和生物学,来评估COMET模型的性能。在计算机视觉领域,作者使用的是CUB-200-2011数据集,它是一个标准的元学习数据集,其任务是根据现有的鸟类图片信息,对鸟类进行分类。在生物学领域,作者使用了一个跨器官细胞类型分类任务和数据集Tabula Muris。

文章比较了COMET在五个基线上的性能,包括Fine-Tune/Baseline++,匹配网络(MatchingNet),模型不可知元学习(MAML),关系网络和原型网络(ProtoNet)。在CUB和Tabula Muris数据集上,COMET的性能都远远超过现有模型。其具体实验结果如表1所示:

表1 600多个随机抽样数据的平均准确率和标准偏差。

同时,作者进一步系统地评估了概念数量对COMET性能的影响。在CUB数据集上,作者根据可见性频率添加概念,而在Tabula Muris数据集,不受概念覆盖范围的限制,随机选择它们。最后的实验结果如图2所示:

图2 概念数对COMET性能的影响

给定一个查询点,COMET会根据概念的重要性分数对其进行排序,从而识别与单个查询点的预测高度相关的概念。为了定量评估为整个类分配概念重要性分数的全局解释,文章在Tabula Muris数据集上证明了基本事实解释。实验对每个类的全局概念重要性得分进行排名,并展示出在5-shot设置中得分最高的前20个概念中成功检索到的相关术语的数量。同时,实验通过调查对CUB数据集的全局解释,进一步展示了整个物种中最相关概念的频率。实验结果如图3所示:

图3 a)Tabula Muris上模型重要性得分。b)CUB上的最相关的鸟类特征重要性分数。

3

相关工作和总结

该研究的工作结合大量关于元学习、成分表征和基于概念的可解释性提出。最近的元学习方法大致分为两类:基于优化的方法和基于度量的方法。文章提出的COMET是原型网络的延伸,是一种新的基于度量的元学习算法,它学习沿着人类可解释的概念维度进行概括。同时,模型借鉴贝叶斯概率程序的工作原理,进行成分表征,类似于单个笔划被组合用于手写字符识别。COMET也是一个内在可解释的模型,它通过从网络的推理过程中获得洞察力来解释预测,类似基于原型的解释模型。最后,各种实验结果表明,COMET能够在不完整、有噪音、冗余、很少或很大概念维度上,选择重要的概念进行分类,并进行概括性表示。且在不同领域的任务上都显著优于现有的方法。

代码

https://github.com/snap-stanford/comet

参考资料

https://arxiv.org/abs/2007.07375

COMET | 概念学习使机器具有人的思维方式相关推荐

  1. Concept Learners for Few-Shot Learning笔记(ICLR 2021)

    Concept Learners for Few-Shot Learning Background -- Few shot learning meta-learning Few-Shot learni ...

  2. 人工智能复习(期末考试)

    1.框架表示法有什么特点?继承性,自然性,结构性. 2.产生式表示法的优点缺点:模块性,清晰性,自然性,有效性 缺点:效率不高,不能表示具有结构关系的知识 3.什么是产生式系统,它是由什么组成的 把一 ...

  3. 没人说得清深度学习的原理 只是把它当作一个黑箱来使

    没人说得清深度学习的原理 只是把它当作一个黑箱来使 人类正在慢慢接近世界的本质--物质只是承载信息模式的载体.人脑之外的器官都只是保障这一使命的给养舰队. 自从去年AlphaGo 完虐李世乭,深度学习 ...

  4. 电子商务中如何使用大数据

    大数据在很多的领域中都有应用,而且大数据所涉及到的领域都有不同程度的进步和发展,这是一个值得欣慰的事情,当然也正是这个原因,很多的行业都争先恐后地使用大数据技术.当然,电子商务也不例外,在这篇文章中我 ...

  5. 终极破产的原因——20年玩儿钱与玩观念的的新经济

    当今世界做什么最赚钱?贸易,制造业,房地产?这些曾经最来钱,现在也不差,可是比起玩儿钱来,都算不了什么.大佬们很清楚,干什么都需要钱,只有玩儿钱的是老大. 现在玩儿钱可不像当年那么累.只要有钱又有贼胆 ...

  6. 人工神经网络研究的目的,人工神经网络训练过程

    1.什么是样本训练? 一般指对人工神经网络训练. 向网络足够多的样本,通过一定算法调整网络的结构(主要是调节权值),使网络的输出与预期值相符,这样的过程就是神经网络训练.根据学习环境中教师信号的差异, ...

  7. 人工智能及职业发展 浅解

    一 整体理解 二 算法工作类型 三 技术体系 四 发展途径 本文目标:1,对人工智能有个整体概念.主观理解:2,对从事人工智能的算法工作类型和技术体系做整体理解:3,对算法工作的发展途径做一个梳理. ...

  8. The Church-Turing thesis

    可判定性:一个语言L,是一个集合,且其补集为 .当L是图灵机可识别时,语言L则称为半可判定.当语言L不是图灵机可识别,则为不可判定语言.当且仅当L和都是图灵机可识别的时候,L才能称为可判定语言. 数理 ...

  9. 机器的崛起:隐藏的控制论历史

    来源:sayonly 在二战后的几年里,计算机作为一种"思维机器"是如此的新奇和未知,而且,进步似乎是无限的. 新的思维机器可以计算得出如何建造摩天大楼.如何经营证券交易所以及如何 ...

最新文章

  1. linux gdb 格式化结构体输出
  2. 面试5家公司,我发现这80道面试题最好用,直中要害
  3. Android下 scrollview的滚动停止事件的监听方法
  4. Python多线程学习教程
  5. Raising Modulo Numbers
  6. Android PopupWindow使用,下拉式PopupWindow,底部式PopupWindow
  7. async 异步编程的应用
  8. 如何将多个文本数据转化为指定数据格式[以电影数据为例](数据预处理)
  9. PSD分层高质量名片样机,完美展示商务身份
  10. 黑科技抗疫,Python 开发者大集结!
  11. 2018美赛 A 题
  12. WinRAR 曝出代码执行漏洞,你的官方中文无广告版该升级了
  13. Ubuntu安装maven
  14. 告别手机自带浏览器,分享2022年好用的手机浏览器
  15. mysql连接显示“message from server :“Host ‘XXXX‘ is not allowed to connect to this MySQL server“”
  16. Java中Scanner的进阶---求和与求平均数
  17. php显示控制器不存在,解决ThinkPHP6提示控制器不存在问题
  18. 计算机基础2008版第7次作业,中医药大学-计算机基础2008版-1-7次作业.doc
  19. 后半生,你越活越好的7个迹象
  20. 深度推荐模型之NFM模型

热门文章

  1. 在三层交换机上配置DHCP
  2. fedora-10-i386下华为联网问题
  3. 滴滴CEO程维:当初把产品拿给美团王兴看,他说了两个字“垃圾”!
  4. 实战 Spring Cloud Gateway 之限流篇
  5. 低成本可复用前端框架——Linke
  6. 当面试官问我ArrayList和LinkedList哪个更占空间时,我这么答让他眼前一亮
  7. 被迫重构代码,这次我干掉了 if-else
  8. 产品需求管理中的四大难点
  9. 小白也能看懂的教程:微信小程序在线支付功能开通详细流程(图文介绍)
  10. springboot多模块打包指定子模块环境配置文件