【李宏毅2020 ML/DL】P15 Why Deep-
我已经有两年 ML 经历,这系列课主要用来查缺补漏,会记录一些细节的、自己不知道的东西。
已经有人记了笔记(很用心,强烈推荐):
https://github.com/Sakura-gh/ML-notes
本节对应笔记:https://sakura-gh.github.io/ML-notes/ML-notes-html/14_Why-Deep.html
本节内容综述
- 本节课承接 【李宏毅2020 ML/DL】P12 Brief Introduction of Deep Learning 内容,开始论述:为什么不是
“广度神经网络”
,而是“深度神经网络”
。 - 参数相同多,但是深的比胖的效果好,见[小细节](#Fat + Short v.s. Thin + Tall)。
- 深度神经网络的优势在于,其是“模块化(
Modularazation
)的”,具体举例见小细节 - 接着,李老师重点讲了Speech中的modularization(模块化)内容。见[小细节](#Speech Modularization)。
- Universality Theorem告诉我们,一层神经网络可以拟合所有函数,但是却没有告诉我们其效率。因此,这并不能说明只用1层就够了。李老师想说明:
深度学习不是用大数据无脑迭代出来的,把网络设计“深度”是有意义的。
- 对于有EE背景的同学,老师又举了
神经网络类比逻辑电路
的例子。见[小细节](#Logic Circuit) - 此外,还讲了
剪窗花
的例子:hidden layer好像将平面对折。老师还做了一个toy experiment来展示:即便数据量不够,深层神经网络也因为提取了特征,比浅层的“崩坏”更有“次序”。 - 此外,有了DL,我们还可以进行端到端学习(End-to-end Learning),不去管中间的东西。
- 比如,在Speech Recognition中,端到端的深度学习是一个非常好的例子。见[小细节](#Speech Recognition End-to-end Learning)
10.此外,还有影像等等例子。DL还有好处,比如针对复杂问题:Very similar input, different output
,Very different input, similar output
,也能自我“学习”解决。
小细节
Fat + Short v.s. Thin + Tall
Modularization
深度神经网络相当于“建了一个决策树,层层提取特征进行分类”。这就实现了Deep
到Modularization
。
对于图像,你可以看出其层层提取了特征。
Speech Modularization
language basics
语句是由音素phoneme
组成的,但是因为人类器官等的限制,其连读时,发音会受到前后因素的影响。
因此,我们要为同一因素准备不同的model,这叫做tri-phone
。
The first stage of speech recognition
这里以语音辨识第一步为例。
首先是,如何将声学特征acoustic feature
转换成state
,这是一个分类问题。
其过程是在声音信号wave form
上滑动时间窗(时间窗不会太大,通常250ms)。
这一步,过去在没有DL前,怎么做呢?
使用HMM-GMM
,即Gaussian Mixture Model
,为每个类建立一个高斯模型。但是这与模型太多了,因此提出Tied-state
,为近似的state
分享一个相同的模型。
但是,这样没有泛化,没有学习到人类发音固有的规律,规律如下图。
规律比如,人类语言里的元音,实际只受三件事影响:
- 舌头的前后位置
- 舌头的上下位置
- 嘴型
有了深度学习后,我们只使用一个DNN网络,所有的state都使用一个模型。 如下图。
这样确实存在泛化:拿一个hidden layer出来,然后把这个层的输出降为到2维以下,如下图。
可见,其确实起到了特征提取或者说区分不同类别的效果。
Logic Circuit
逻辑电路中,两层逻辑闸就可以做一切逻辑;但是,电脑不会只有两层,还是需要模块化。神经网络同理。
李老师想说明:深度学习不是用大数据无脑迭代出来的,把网络设计“深度”是有意义的。
Speech Recognition End-to-end Learning
传统的语音识别,要通过傅里叶变换等等操作(前五道绿色工序),其定制性非常强,而只有最后的GMM是由数据训练出来的。
后来有了DL,直接查看输入、输出就好,中间的绿色工序处理,不需要。
【李宏毅2020 ML/DL】P15 Why Deep-相关推荐
- 【李宏毅2020 ML/DL】P107-109 Deep Reinforcement Learning | Scratching the surface
我已经有两年 ML 经历,这系列课主要用来查缺补漏,会记录一些细节的.自己不知道的东西. 关于强化学习,我专门花半年时间学习实践过,因此这里笔记只记录李老师的 outline .我的强化学习资源仓库: ...
- 【李宏毅2020 ML/DL】P86-87 More about Domain Adaptation
我已经有两年 ML 经历,这系列课主要用来查缺补漏,会记录一些细节的.自己不知道的东西. 本节内容综述 本节课由助教 Chao Brian 讲解. 首先讲解些领域适配的基础内容,包括名词.定义等. 接 ...
- 【李宏毅2020 ML/DL】P59 Unsupervised Learning - Auto-encoder
我已经有两年 ML 经历,这系列课主要用来查缺补漏,会记录一些细节的.自己不知道的东西. 已经有人记了笔记(很用心,强烈推荐):https://github.com/Sakura-gh/ML-note ...
- 【李宏毅2020 ML/DL】P1 introduction
[李宏毅2020 ML/DL]P1 introduction 本节主要介绍了 DL 的15个作业 英文大意 Regression: 回归分析 Classification: 分类 RNN: 循环神经网 ...
- 【李宏毅2020 ML/DL】P58 Unsupervised Learning - Neighbor Embedding | LLE, t-SNE
我已经有两年 ML 经历,这系列课主要用来查缺补漏,会记录一些细节的.自己不知道的东西. 已经有人记了笔记(很用心,强烈推荐):https://github.com/Sakura-gh/ML-note ...
- 【李宏毅2020 ML/DL】P14 Tips for training DNN | 激活函数、Maxout、正则、剪枝 Dropout
我已经有两年 ML 经历,这系列课主要用来查缺补漏,会记录一些细节的.自己不知道的东西. 已经有人记了笔记(很用心,强烈推荐): https://github.com/Sakura-gh/ML-not ...
- 李宏毅svm_李宏毅2020 ML/DL补充Structured Learning Structured SVM
李宏毅2020 ML/DL补充Structured Learning Structured SVM [李宏毅2020 ML/DL]补充:Structured Learning: Structured ...
- 【李宏毅2020 ML/DL】P20-21 Recurrent Neural Network | “Deep and structure is future.“
我已经有两年 ML 经历,这系列课主要用来查缺补漏,会记录一些细节的.自己不知道的东西. 已经有人记了笔记(很用心,强烈推荐):https://github.com/Sakura-gh/ML-note ...
- 【李宏毅2020 ML/DL】P12 Brief Introduction of Deep Learning
我已经有两年 ML 经历,这系列课主要用来查缺补漏,会记录一些细节的.自己不知道的东西. 已经有人记了笔记(很用心,强烈推荐): https://github.com/Sakura-gh/ML-not ...
最新文章
- 【Netty】Netty 核心组件 ( Pipeline | ChannelPipeline )
- jvm性能调优实战 -57数据日志分析系统的OOM问题排查
- 路灯智能控制系统_在plc的智能路灯控制系统设计,你必须清楚
- 学JS的心路历程-Promise(一)
- item 24: 区分右值引用和universal引用
- JS时间戳和时间互转
- 工作211:新的封装组件 秒呀
- 通过导入txt数据画出python turtle图形_【Python】txt文件读取绘画
- python自动化测试怎么提高效率_自动化测试更适合缺陷预防,而不是提高测试效率...
- 第五章 基于QT和DCMTK的Dicom 图像浏览器---Dicom图像序列类
- 【逗老师的小技巧】群晖使用DELL H330(LSI 3008)RAID卡刷IT直通模式
- IOS逆向(5)Tweak代码编写
- VC++数据库应用开发
- 【书评】《你好哇,程序员——漫话程序员面试求职、升职加薪、创业与生活》
- 在手机上进行python开发的软件推荐
- java关于int极限值的测试
- 设计模式 工厂模式 从卖肉夹馍说起
- 横空出世。复盘B站面试坑我最深的Java并发:JDK源码剖析。B站五面面经(附过程、答案)
- Phpstorm好用插件
- 如何清理C盘的垃圾文件
热门文章
- mysql 2049_mysql数据库备份与还原,解决40101和ERROR 2049错误
- WCF中因序列化问题引起的异常和错误。
- SharePoint 创建 Lookup 类型的Site Column解决跨站问题
- DOS批处理不支持将UNC 路径作为当前目录的巧妙解决方案
- 未能加载文件或程序集 CrystalDecisions.Web Version=10.2.3600解决方法
- 大数据学习系列之八----- Hadoop、Spark、HBase、Hive搭建环境遇到的错误以及解决方法
- 在Java中使用instanceof的性能影响
- php josnp_浅析php中jsonp的跨域实例
- pip源使用国内镜像
- STM32 LWIP实验第一章节--了解以太网