我已经有两年 ML 经历,这系列课主要用来查缺补漏,会记录一些细节的、自己不知道的东西。

已经有人记了笔记(很用心,强烈推荐):
https://github.com/Sakura-gh/ML-notes

本节对应笔记:https://sakura-gh.github.io/ML-notes/ML-notes-html/14_Why-Deep.html

本节内容综述

  1. 本节课承接 【李宏毅2020 ML/DL】P12 Brief Introduction of Deep Learning 内容,开始论述:为什么不是“广度神经网络”,而是“深度神经网络”
  2. 参数相同多,但是深的比胖的效果好,见[小细节](#Fat + Short v.s. Thin + Tall)。
  3. 深度神经网络的优势在于,其是“模块化(Modularazation)的”,具体举例见小细节
  4. 接着,李老师重点讲了Speech中的modularization(模块化)内容。见[小细节](#Speech Modularization)。
  5. Universality Theorem告诉我们,一层神经网络可以拟合所有函数,但是却没有告诉我们其效率。因此,这并不能说明只用1层就够了。李老师想说明:深度学习不是用大数据无脑迭代出来的,把网络设计“深度”是有意义的。
  6. 对于有EE背景的同学,老师又举了神经网络类比逻辑电路的例子。见[小细节](#Logic Circuit)
  7. 此外,还讲了剪窗花的例子:hidden layer好像将平面对折。老师还做了一个toy experiment来展示:即便数据量不够,深层神经网络也因为提取了特征,比浅层的“崩坏”更有“次序”。
  8. 此外,有了DL,我们还可以进行端到端学习(End-to-end Learning),不去管中间的东西。
  9. 比如,在Speech Recognition中,端到端的深度学习是一个非常好的例子。见[小细节](#Speech Recognition End-to-end Learning)
    10.此外,还有影像等等例子。DL还有好处,比如针对复杂问题:Very similar input, different outputVery different input, similar output,也能自我“学习”解决。

小细节

Fat + Short v.s. Thin + Tall

Modularization

深度神经网络相当于“建了一个决策树,层层提取特征进行分类”。这就实现了DeepModularization

对于图像,你可以看出其层层提取了特征。

Speech Modularization

language basics

语句是由音素phoneme组成的,但是因为人类器官等的限制,其连读时,发音会受到前后因素的影响。

因此,我们要为同一因素准备不同的model,这叫做tri-phone

The first stage of speech recognition

这里以语音辨识第一步为例。

首先是,如何将声学特征acoustic feature转换成state,这是一个分类问题。

其过程是在声音信号wave form上滑动时间窗(时间窗不会太大,通常250ms)。

这一步,过去在没有DL前,怎么做呢?

使用HMM-GMM,即Gaussian Mixture Model,为每个类建立一个高斯模型。但是这与模型太多了,因此提出Tied-state,为近似的state分享一个相同的模型。

但是,这样没有泛化,没有学习到人类发音固有的规律,规律如下图。

规律比如,人类语言里的元音,实际只受三件事影响:

  • 舌头的前后位置
  • 舌头的上下位置
  • 嘴型

有了深度学习后,我们只使用一个DNN网络,所有的state都使用一个模型。 如下图。

这样确实存在泛化:拿一个hidden layer出来,然后把这个层的输出降为到2维以下,如下图。

可见,其确实起到了特征提取或者说区分不同类别的效果。

Logic Circuit

逻辑电路中,两层逻辑闸就可以做一切逻辑;但是,电脑不会只有两层,还是需要模块化。神经网络同理。

李老师想说明:深度学习不是用大数据无脑迭代出来的,把网络设计“深度”是有意义的。

Speech Recognition End-to-end Learning

传统的语音识别,要通过傅里叶变换等等操作(前五道绿色工序),其定制性非常强,而只有最后的GMM是由数据训练出来的。

后来有了DL,直接查看输入、输出就好,中间的绿色工序处理,不需要。

【李宏毅2020 ML/DL】P15 Why Deep-相关推荐

  1. 【李宏毅2020 ML/DL】P107-109 Deep Reinforcement Learning | Scratching the surface

    我已经有两年 ML 经历,这系列课主要用来查缺补漏,会记录一些细节的.自己不知道的东西. 关于强化学习,我专门花半年时间学习实践过,因此这里笔记只记录李老师的 outline .我的强化学习资源仓库: ...

  2. 【李宏毅2020 ML/DL】P86-87 More about Domain Adaptation

    我已经有两年 ML 经历,这系列课主要用来查缺补漏,会记录一些细节的.自己不知道的东西. 本节内容综述 本节课由助教 Chao Brian 讲解. 首先讲解些领域适配的基础内容,包括名词.定义等. 接 ...

  3. 【李宏毅2020 ML/DL】P59 Unsupervised Learning - Auto-encoder

    我已经有两年 ML 经历,这系列课主要用来查缺补漏,会记录一些细节的.自己不知道的东西. 已经有人记了笔记(很用心,强烈推荐):https://github.com/Sakura-gh/ML-note ...

  4. 【李宏毅2020 ML/DL】P1 introduction

    [李宏毅2020 ML/DL]P1 introduction 本节主要介绍了 DL 的15个作业 英文大意 Regression: 回归分析 Classification: 分类 RNN: 循环神经网 ...

  5. 【李宏毅2020 ML/DL】P58 Unsupervised Learning - Neighbor Embedding | LLE, t-SNE

    我已经有两年 ML 经历,这系列课主要用来查缺补漏,会记录一些细节的.自己不知道的东西. 已经有人记了笔记(很用心,强烈推荐):https://github.com/Sakura-gh/ML-note ...

  6. 【李宏毅2020 ML/DL】P14 Tips for training DNN | 激活函数、Maxout、正则、剪枝 Dropout

    我已经有两年 ML 经历,这系列课主要用来查缺补漏,会记录一些细节的.自己不知道的东西. 已经有人记了笔记(很用心,强烈推荐): https://github.com/Sakura-gh/ML-not ...

  7. 李宏毅svm_李宏毅2020 ML/DL补充Structured Learning Structured SVM

    李宏毅2020 ML/DL补充Structured Learning Structured SVM [李宏毅2020 ML/DL]补充:Structured Learning: Structured ...

  8. 【李宏毅2020 ML/DL】P20-21 Recurrent Neural Network | “Deep and structure is future.“

    我已经有两年 ML 经历,这系列课主要用来查缺补漏,会记录一些细节的.自己不知道的东西. 已经有人记了笔记(很用心,强烈推荐):https://github.com/Sakura-gh/ML-note ...

  9. 【李宏毅2020 ML/DL】P12 Brief Introduction of Deep Learning

    我已经有两年 ML 经历,这系列课主要用来查缺补漏,会记录一些细节的.自己不知道的东西. 已经有人记了笔记(很用心,强烈推荐): https://github.com/Sakura-gh/ML-not ...

最新文章

  1. 【Netty】Netty 核心组件 ( Pipeline | ChannelPipeline )
  2. jvm性能调优实战 -57数据日志分析系统的OOM问题排查
  3. 路灯智能控制系统_在plc的智能路灯控制系统设计,你必须清楚
  4. 学JS的心路历程-Promise(一)
  5. item 24: 区分右值引用和universal引用
  6. JS时间戳和时间互转
  7. 工作211:新的封装组件 秒呀
  8. 通过导入txt数据画出python turtle图形_【Python】txt文件读取绘画
  9. python自动化测试怎么提高效率_自动化测试更适合缺陷预防,而不是提高测试效率...
  10. 第五章 基于QT和DCMTK的Dicom 图像浏览器---Dicom图像序列类
  11. 【逗老师的小技巧】群晖使用DELL H330(LSI 3008)RAID卡刷IT直通模式
  12. IOS逆向(5)Tweak代码编写
  13. VC++数据库应用开发
  14. 【书评】《你好哇,程序员——漫话程序员面试求职、升职加薪、创业与生活》
  15. 在手机上进行python开发的软件推荐
  16. java关于int极限值的测试
  17. 设计模式 工厂模式 从卖肉夹馍说起
  18. 横空出世。复盘B站面试坑我最深的Java并发:JDK源码剖析。B站五面面经(附过程、答案)
  19. Phpstorm好用插件
  20. 如何清理C盘的垃圾文件

热门文章

  1. mysql 2049_mysql数据库备份与还原,解决40101和ERROR 2049错误
  2. WCF中因序列化问题引起的异常和错误。
  3. SharePoint 创建 Lookup 类型的Site Column解决跨站问题
  4. DOS批处理不支持将UNC 路径作为当前目录的巧妙解决方案
  5. 未能加载文件或程序集 CrystalDecisions.Web Version=10.2.3600解决方法
  6. 大数据学习系列之八----- Hadoop、Spark、HBase、Hive搭建环境遇到的错误以及解决方法
  7. 在Java中使用instanceof的性能影响
  8. php josnp_浅析php中jsonp的跨域实例
  9. pip源使用国内镜像
  10. STM32 LWIP实验第一章节--了解以太网