大数据是时代的悲哀

——众所周知,深度学习需要大量的样本。数据增广和正则化,可以稍微降低由于数据不足带来的过拟合,但却无法真正解决这个问题。另外,对参数化模型的学习速度很慢,而非参数化模型——如最近邻法NN——却可以快速学习新样本。

人类对新知识的学习只需很少的监督,例如:一个儿童仅从一本书中的一副画就可以学习到“斑马”的概念,而我们最好的深度学习系统却需要几百上千个样本。这个差距,就是驱使我们进行单样本学习的原因。

2017年google deepmind——就是那个用电脑击败围棋国手李师师的那个公司——的研究人员在arXiv上发布了Matching Networks for One Shot Learning一文,研究了视觉和语言上的单样本学习问题,提出了的一种网络模型叫做匹配网络,将ImageNet的单样本识别精度从87.6%提高到了93.2%,对Omniglot从88.0%提高到93.8%。匹配网络的思路是:基于深度神经特征的度量学习+外部存储增强的神经网络。它学习如何将一个小标签数据集和一个无标签样本映射到其标签,而不用对新的类别进行微调。

这篇论文提出了一种与通常的监督学习不同的学习方法:一般有监督学习的训练集与测试集虽然互不重合,但它们的标签是重合的;而匹配网络的训练集与测试集的标签是不重合的,即测试集所用的标签从未在训练时出现过。换句话说,匹配网络学习的是学习方法,而不是学习内容。这就像一个高明的老师,他教给学生的不再是死记硬背已有的概念和公式,而是教给学生学习方法。

就像高考刷题,同样是题海战术,有些学生只会死记硬背固定的题型,而那些被称为学霸的学生却能学会举一反三。

本文的创新点:1)提出匹配网络MN模型,采用最近在注意力和记忆方面的成果,达到快速学习的目的。2)训练过程基于简单的机器学习原理:测试和训练条件必须匹配。为了达到快速学习的目的,每个类只用很少的样本去训练它,每个minibatch对应一个类,就好像在测试时每个类只有很少的几个样本一样。

他们战胜了韩国的李师师相关推荐

  1. Python 多进程、协程异步抓取英雄联盟皮肤并保存在本地

    作者 | 俊欣 来源 | 关于数据分析与可视化 就在11月7日晚间,<英雄联盟>S11赛季全球总决赛决斗,在冰岛拉开"帷幕",同时面向全球直播.在经过了5个小时的鏖战, ...

  2. 你知道人工智能为什么这么火?

    近几年,人工智能领域可以说火的一塌糊涂,随着一系列相关新闻的出现,更是打开了大部分人对于人工智能认知的新大门.所以,人工智能为什么这么火?我们生活中又接触着哪些人工智能? 无人驾驶汽车 也许有不少人认 ...

  3. 图灵奖得主杨立昆:人工智能比你更聪明吗?

    来源:混沌巡洋舰 人工智能常常被认为是一项将要颠覆世界的技术,从这一概念诞生至今的65年中,无数电影与小说塑造了各种经典的人工智能角色,AI (Artificial Intelligence)也很快成 ...

  4. 互联网大脑进化简史,华为云EI智能体加入-2018年7月新版

    要:华为云EI智能体是2018年以来产生的第八个类脑智能巨系统,在中国,目前除了小米.联想.今日头条,几乎所有的互联网巨头都提出了自己的"大脑"系统建设计划. 1969年互联网诞生 ...

  5. 一文看懂深度学习与计算机视觉

    from:http://www.eefocus.com/component/362248 今年夏天,将在深圳举办"全球人工智能与机器人创新大会"(GAIR),在本次大会上,我们将发 ...

  6. 游戏中的AI及实用算法逻辑

    这篇文章就不加具体的项目代码了,毕竟"敲代码是只是在一栋大楼设计好后具体的搬砖工作",程序猿贵在对这张图纸的设计好坏.再者这个话题我这车开的还不够稳,讲多了就翻车了.所以就跟大家分 ...

  7. 人工智能为什么这么火?

    近几年,人工智能领域可以说火的一塌糊涂,随着一系列相关新闻的出现,更是打开了大部分人对于人工智能认知的新大门.所以,人工智能为什么这么火?我们生活中又接触着哪些人工智能? 无人驾驶汽车 也许有不少人认 ...

  8. 大手笔!EDG夺冠TCL奖励300万,还送全系AI家电一套

    11月7日凌晨,<英雄联盟>S11赛季全球总决赛结束,经过5个小时的比赛,EDG战队鏖战五局,最终以3:2战胜来自韩国LCK赛区的DK战队,拿下<英雄联盟>S11全球总决赛冠军 ...

  9. EDG夺冠!每个队员获赠一套房:背后老板成最大赢家

    昨日凌晨,<英雄联盟>S11赛季全球总决赛结束,经过5个小时的比赛,EDG战队鏖战五局,最终以3:2战胜来自韩国LCK赛区的DK战队,拿下<英雄联盟>S11全球总决赛冠军. 在 ...

最新文章

  1. 5G 标准 — R15
  2. HTML5 浏览器接收的常用 content-type
  3. SD-WAN成本节省取决于基础WAN技术
  4. js进阶 11-16 jquery如何查找元素的父亲、祖先和子代、后代
  5. 拆分工作簿为多个文件_掌握这几行代码,快速拆分Excel工作簿(内含源码)
  6. 知识蒸馏在推荐系统中的应用
  7. [数据结构]用插入排序和选择排序的思想实现优先级队列
  8. 高校寒假时间公布!看完心态稳住…
  9. 四元数姿态解算c语言例程_(21)用四元数插值来对齐IMU和图像帧
  10. Leetcode200岛屿数量(深搜)
  11. 史上最全计算机毕业设计题目4(10万套,大部分全国唯一)
  12. 关于vba word的一些用法
  13. FinsTCP协议的Java Socket
  14. 【HotSpot、G1】垃圾回收算法和垃圾收集器
  15. 盘点 2019 Python中文社区十大热门文章
  16. I DID IT 推广二番 | ArcBlock 发布汇款转账应用 Demo
  17. 爬虫进阶-如何进行app爬取
  18. 2022年下半年 系统架构师,论文-软件开发模型(Software Development Model)
  19. arduino与蓝牙模块
  20. 微营销实战demo coffee

热门文章

  1. Linux安装RPM包、查看本机ip和端口、手动配置ip、中标麒麟无法显示ip地址的详细解决方法
  2. Nero 7 Premium Reloaded 7.8.5.0
  3. 详解卷积神经网络的卷积过程--简单明了
  4. HTML网页设计:周杰伦网站
  5. 互联网是如何组建的,为什么需要IP地址和MAC地址?
  6. 中国医学计算机成级别像杂志,中国医学计算机成像杂志停刊了吗
  7. 有向图的强连通分量----------银河
  8. 微软发布支持Linux的SQL Server
  9. 堡垒机拓扑图_fanzhenlong/堡垒机部署方案总结.md at master · leadsino/fanzhenlong · GitHub...
  10. 怎样把ogg格式转换mp3