深度学习最令人振奋的最新动态之一,就是端到端深度学习end-to-end deep learning的兴起。

什么是“端到端深度学习”

以前有一些数据处理系统或学习系统,它们需要多个阶段的处理。

端到端深度学习end-to-end deep learning简而言之就是:忽略这些不同的阶段,用单个的神经网络替代它。

例子如下:

端到端深度学习的挑战之一是:需要大量的数据才能让系统表现良好。

根据数据集的大小可大致分为下面几种情况:

  • 少量数据集
    比如你有3000小时的数据去训练语音识别系统,那么传统的流水线效果真的很好。
  • 大量数据集
    但当有非常大的数据集时,比如10000小时的数据或者100000小时,这时候端到端深度学习就 suddenly starts to work really well。
  • 数据量适中
    也可以用中间件方法,但可以将多个连续的阶段组合到一起,然后用端到端深度学习替代。

另一个人脸识别的门禁系统:

在这个例子中,将识别过程分为两步(人脸检测+人脸识别),要好于直接用端对端深度学习。

原因如下:

  • 将一个问题分为两个问题,每个问题实际上要简单得多(each of two problems you’re solving is actually much simpler)
  • 两个子训练集数据都很多,而直接满足端到端深度学习的训练数据要少得多。

端对端深度学习的优缺点


对应的来解释一下:
pros:

  • 不会引入人类的知识(比如音位),从而可能更能捕获数据中的任何统计信息,而不是被迫引入人类的成见。
  • 没有需要解释的

cons:

  • 有可能满足子任务的数据很多,而满足端到端深度学习的数据很少。
  • 在没有足够数据的情况下,加入手工组件可能是把人类知识直接注入算法的途径,而这不总是一件坏事情。

吴恩达老师认为:
学习算法有两个主要的知识来源,一个是数据,一个是你手工设计的任何东西。
当你有成吨数据时,手工设计的东西就不太重要了。但当你没有太多的数据时,构造一个精心设计的系统实际上可以将人类对这个问题的很多认识直接注入到问题里,and should help。

何时使用端对端深度学习


有足够多的数据去完成x到y的映射。

吴恩达神经网络和深度学习-学习笔记-28-端到端的深度学习(end-to-end deep learning )相关推荐

  1. 吴恩达神经网络和深度学习-学习笔记-38-使用开源的方案+迁移学习+数据增强data augmentation

    使用别人的开源成果 想要用现成的网络,最好在网络上找到开源的实现,这要比从头开始实现快得多. 比如:直接在Google上搜索resnets github,找到合适的后点击下载会得到URL,然后在cmd ...

  2. 吴恩达神经网络与深度学习——深度神经网络

    吴恩达神经网络与深度学习--深度神经网络 深度神经网络 符号 前向传播 矩阵维度 m个样本 为什么使用深层表示 搭建深层神经网络块 正向传播和反向传播 前向和反向传播 前向传播 反向传播 参数和超参数 ...

  3. 吴恩达神经网络和深度学习

    [前言] 在学习了深度学习和神经网络之后,为什么我要以博客的形式来做笔记?这CSDN有那么多的优秀文章,我自己写的都比不上 别人的我写的真的有意义吗,为什么我要浪费大量的时间去做这项工作?我相信一句话 ...

  4. 吴恩达神经网络与深度学习——浅层神经网络

    吴恩达神经网络与深度学习--浅层神经网络 神经网络概述 神经网络表示 计算神经网络的输出 m个样本的向量化 for loop 向量化 向量化实现的解释 激活函数 sigmoid tanh函数 ReLu ...

  5. 吴恩达神经网络1-2-2_图神经网络进行药物发现-第1部分

    吴恩达神经网络1-2-2 预测溶解度 (Predicting Solubility) 相关资料 (Related Material) Jupyter Notebook for the article ...

  6. 吴恩达神经网络1-2-2_图神经网络进行药物发现-第2部分

    吴恩达神经网络1-2-2 预测毒性 (Predicting Toxicity) 相关资料 (Related Material) Jupyter Notebook for the article Jup ...

  7. 完结篇 | 吴恩达《序列模型》精炼笔记(3)-- 序列模型和注意力机制

    AI有道 不可错过的AI技术公众号 关注 1 Basic Models Sequence to sequence(序列)模型在机器翻译和语音识别方面都有着广泛的应用.下面,我们来看一个机器翻译的简单例 ...

  8. 完结篇 | 吴恩达deeplearning.ai专项课程精炼笔记全部汇总

    红色石头的个人网站:redstonewill.com 从去年8月份开始,AI界大IP吴恩达在coursera上开设了由5们课组成的深度学习专项课程,掀起了一股人工智能深度学习热潮.这里附上deeple ...

  9. 吴恩达《序列模型》精炼笔记(2)-- NLP和Word Embeddings

    AI有道 不可错过的AI技术公众号 关注 1 Word Representation 上节课我们介绍过表征单词的方式是首先建立一个较大的词汇表(例如10000),然后使用one-hot的方式对每个单词 ...

最新文章

  1. STL学习小记--与C++模板相关的几个特性
  2. springboot jar服务器运行后无法请求_Spring boot、微服务、OAuth、OpenID的爱恨情仇!...
  3. 一步一步学Silverlight 2系列(33):Silverlight 2应用Web Service两例
  4. 理论基础 —— 排序 —— 归并排序
  5. jdbc连接oracle数据库
  6. 为什么我不推荐Python初学者直接看项目源码?工作五年的程序员给的忠告
  7. 端口号及对应的服务汇总 (适用于Linux/Windows系统)
  8. 拿到参考资料的预训练模型,太可怕了!
  9. 组了个视频号的局,汇报下数据!
  10. HTML_BOM-01
  11. netperf测试工具
  12. 计算机语言元素周期表,元素周期表高清大图
  13. matlab 取数组第一行,matlab中如取数组的矩阵的一行出来成为一个向量?
  14. 类似搜狐新闻的栏目定制
  15. 互联网快讯:极米Z6X Pro、极米H3S获用户青睐;民德电子功率半导体赛道获进展
  16. P21图像边缘发现(锐化):二阶导
  17. 职场新人如何发公司内部邮件
  18. 2.使用Gateway实现token校验
  19. C++中int a[10]和int* a=new int[10]]有什么区别
  20. 带你来看全国3000所高等院校分布

热门文章

  1. python装饰器详解-Python装饰器基础详解
  2. 苹果 iPhone/iPad 第三方键盘为何没语音听写功能?真相了
  3. 人工智能感知技术是机器人应用支撑技术之一
  4. java url压缩_URL压缩算法的短地址
  5. 利用jquery实现数字千分位排版显示,使用0动态补全8位数
  6. 单字节字符集,多字节字符集,Unicode
  7. java implements this,Java – 何时使用“this”关键字
  8. http get post java_Java发送http的get、post请求 - 穿梭于偶然
  9. liunx安装和部署nacos
  10. Maven引用本地jar并在打war包时引用jar