←上一篇 ↓↑ 下一篇→
4.1 什么是人脸识别? 回到目录 4.3 Siamese 网络

One-Shot 学习 (One-Shot Learning)

人脸识别所面临的一个挑战就是你需要解决一次学习问题,这意味着在大多数人脸识别应用中,你需要通过单单一张图片或者单单一个人脸样例就能去识别这个人。而历史上,当深度学习只有一个训练样例时,它的表现并不好,让我们看一个直观的例子,并讨论如何去解决这个问题。

假设你的数据库里有4张你们公司的员工照片,实际上他们确实是我们deeplearning.ai的员工,分别是Kian,Danielle,YounesTian。现在假设有个人(编号1所示)来到办公室,并且她想通过带有人脸识别系统的栅门,现在系统需要做的就是,仅仅通过一张已有的Danielle照片,来识别前面这个人确实是她。相反,如果机器看到一个不在数据库里的人(编号2所示),机器应该能分辨出她不是数据库中四个人之一。

所以在一次学习问题中,只能通过一个样本进行学习,以能够认出同一个人。大多数人脸识别系统都需要解决这个问题,因为在你的数据库中每个雇员或者组员可能都只有一张照片。

有一种办法是,将人的照片放进卷积神经网络中,使用softmax单元来输出4种,或者说5种标签,分别对应这4个人,或者4个都不是,所以softmax里我们会有5种输出。但实际上这样效果并不好,因为如此小的训练集不足以去训练一个稳健的神经网络。

而且,假如有新人加入你的团队,你现在将会有5个组员需要识别,所以输出就变成了6种,这时你要重新训练你的神经网络吗?这听起来实在不像一个好办法。

所以要让人脸识别能够做到一次学习,为了能有更好的效果,你现在要做的应该是学习Similarity函数。详细地说,你想要神经网络学习这样一个用 ddd 表示的函数, d(img1,img2)=degree of difference between images ,它以两张图片作为输入,然后输出这两张图片的差异值。如果你放进同一个人的两张照片,你希望它能输出一个很小的值,如果放进两个长相差别很大的人的照片,它就输出一个很大的值。所以在识别过程中,如果这两张图片的差异值小于某个阈值 τττ ,它是一个超参数,那么这时就能预测这两张图片是同一个人,如果差异值大于 τττ ,就能预测这是不同的两个人,这就是解决人脸验证问题的一个可行办法。

要将它应用于识别任务,你要做的是拿这张新图片(编号6),然后用 ddd 函数去比较这两张图片(编号1和编号6),这样可能会输出一个非常大的数字,在该例中,比如说这个数字是10。之后你再让它和数据库中第二张图(编号2)片比较,因为这两张照片是同一个人,所以我们希望会输出一个很小的数。然后你再用它与数据库中的其他图片(编号3、4)进行比较,通过这样的计算,最终你能够知道,这个人确实是Danielle。

对应的,如果某个人(编号7)不在你的数据库中,你通过函数 ddd 将他们的照片两两进行比较,最后我们希望 ddd 会对所有的比较都输出一个很大的值,这就证明这个人并不是数据库中4个人的其中一个。

要注意在这过程中你是如何解决一次学习问题的,只要你能学习这个函数 ddd ,通过输入一对图片,它将会告诉你这两张图片是否是同一个人。如果之后有新人加入了你的团队(编号5),你只需将他的照片加入你的数据库,系统依然能照常工作。

现在你已经知道函数 ddd 是如何工作的,通过输入两张照片,它将让你能够解决一次学习问题。那么,下节视频中,我们将会学习如何训练你的神经网络学会这个函数 ddd 。

课程板书




←上一篇 ↓↑ 下一篇→
4.1 什么是人脸识别? 回到目录 4.3 Siamese 网络

4.2 One-Shot 学习-深度学习第四课《卷积神经网络》-Stanford吴恩达教授相关推荐

  1. 1.1 欢迎-深度学习第一课《神经网络与深度学习》-Stanford吴恩达教授

    ←上一篇 ↓↑ 下一篇→ 无 回到目录 1.2 什么是神经网络 欢迎 第一个视频主要讲了什么是深度学习,深度学习能做些什么事情.以下是吴恩达老师的原话: 深度学习改变了传统互联网业务,例如如网络搜索和 ...

  2. 2.19 总结-深度学习-Stanford吴恩达教授

    ←上一篇 ↓↑ 下一篇→ 2.18 Logistic 损失函数的解释 回到目录 3.1 神经网络概览 文章目录 总结 习题 第 11 题 第 12 题 第 13 题 第 14 题 第 15 题 第 1 ...

  3. 吴恩达卷积神经网络 笔记,吴恩达 深度神经网络

    如何评价吴恩达的学术地位 吴恩达(AndrewNg),斯坦福计算机系的副教授,师从机器学习的大师级人物MichaelI.Jordan. 同门师兄弟包括ZoubinGhahramani,TommiJaa ...

  4. 4.1 什么是人脸识别-深度学习第四课《卷积神经网络》-Stanford吴恩达教授

    ←上一篇 ↓↑ 下一篇→ 3.11 总结 回到目录 4.2 One-Shot 学习 什么是人脸识别 (What is face recognition?) 欢迎来到第四周,即这门课卷积神经网络课程的最 ...

  5. 3.12 总结-深度学习-Stanford吴恩达教授

    ←上一篇 ↓↑ 下一篇→ 3.11 随机初始化 回到目录 4.1 深层神经网络 文章目录 总结 习题 第 21 题 第 22 题 第 23 题 第 24 题 第 25 题 第 26 题 第 27 题 ...

  6. 3.5 向量化实现的解释-深度学习-Stanford吴恩达教授

    ←上一篇 ↓↑ 下一篇→ 3.4 多个例子中的向量化 回到目录 3.6 激活函数 向量化实现的解释 (Explanation for Vectorized Implementation) 在上一个视频 ...

  7. 大总结-深度学习全五课-Stanford吴恩达教授

    大总结 深度学习符号 此笔记中使用的数学符号参考自<深度学习>和 Deep learning specialization 常用的定义 原版符号定义中, x(i)x^{(i)}x(i) 与 ...

  8. 3.11 结论和致谢-深度学习第五课《序列模型》-Stanford吴恩达教授

    结论和致谢 (Conclusion and thank you) 恭喜你能走到这一步,在最后这节视频中,只想做个总结,并给你一些最后的想法. 我们一起经历了一段很长的旅程,如果你已经学完了整个专业的课 ...

  9. 3.10 触发字检测-深度学习第五课《序列模型》-Stanford吴恩达教授

    触发字检测 (Trigger Word Detection) 现在你已经学习了很多关于深度学习和序列模型的内容,于是我们可以真正去简便地描绘出一个触发字系统(a trigger word system ...

  10. 3.8 注意力模型-深度学习第五课《序列模型》-Stanford吴恩达教授

    注意力模型 (Attention Model) 在上个视频中你已经见到了,注意力模型如何让一个神经网络只注意到一部分的输入句子.当它在生成句子的时候,更像人类翻译.让我们把这些想法转化成确切的式子,来 ...

最新文章

  1. 从iso镜像升级ubuntu
  2. Linux学习之系统编程篇:读写锁(pthread_ rwlock _init / rdlock / wrlock / unlock / destroy)
  3. sqlite to mysql_SqliteToMysql
  4. leetcode 199. Binary Tree Right Side View | 199. 二叉树的右视图(Java)
  5. php mysql插入的数据有引号_php – 由于’引号’的不同,数据没有插入到mysql数据库中...
  6. html整体引入js,html页面用js引入js的方式
  7. JavaScript学习笔记:创建自定义对象
  8. php 删除相对应的id,PHP 在下面这个留言板代码中加入删除按钮,每一个删除按钮删除相对应一行数据,这怎么弄...
  9. js放到head中失效的原因与解决方法
  10. The Normal Distributions Transform: A New Approach to Laser Scan Matching
  11. js删除字符串的最后一个字符几种方法
  12. SQL教程——TCL语言
  13. 超实用超全 || ZBrush笔刷大合集
  14. 桃李春风一杯酒,江湖夜雨十年灯。—第十一天
  15. java 滚动字幕_Java程序 实现图形面板上的字幕滚动效果
  16. Ubuntu 10.4 .安装Cairo-dock
  17. android手机投屏电视用什么,华为手机哪一款最好用 华为手机投屏到电视的5种方法...
  18. 盘点那些以“马”作为车标的汽车品牌
  19. php更换鼠标指针详细,鼠标指针替换教程(修正版 )
  20. IAP的无线版(stm32无线下载程序)(基于有线升级)

热门文章

  1. python学习历程-安装篇(一)
  2. Python版本OpenCV安装配置及简单实例
  3. Hadoop-2.4.1学习之edits和fsimage查看器
  4. Winform应用程序实现通用遮罩层二
  5. 【计算机视觉】Objectness算法(一)---总体理解,整理及总结
  6. 个人工作总结09(第二阶段)
  7. @@ROWCOUNT 含义
  8. cocos2dx环境搭建(android平台)
  9. linux c/c++ 代码使用 doxygen 自动生成文档
  10. UA PHYS515A 电磁理论III 静磁学问题3 静磁学问题的边界条件与标量势方法的应用