吴恩达 NIPS 2016:利用深度学习开发人工智能应用的基本要点(含唯一的中文版PPT)...
雷锋网按:为了方便读者学习和收藏,雷锋网(公众号:雷锋网)特地把吴恩达教授在NIPS 2016大会中的PPT做为中文版,由三川和亚峰联合编译并制作。
今日,在第 30 届神经信息处理系统大会(NIPS 2016)中,百度首席科学家吴恩达教授发表演讲:《利用深度学习开发人工智能应用的基本要点(Nuts and Bolts of Building Applications using Deep Learning)》。
此外,吴恩达教授曾在今年 9 月 24/25 日也发表过同为《Nuts and Bolts of Applying Deep Learning》的演讲(1小时20分钟),以下是 YouTube 链接:
https://www.youtube.com/watch?v=F1ka6a13S9I
一、深度学习为何崛起
吴恩达在开场提到:深度学习为何这么火?
答案很简单:
第一是因为规模正在推动深度学习的进步。
从传统算法到小型神经网络、中型神经网络最后演化为现在的大型神经网络。
第二:端到端学习的崛起
从下图中的上半部分可以看出,传统端到端学习是把实体数据表达成数字数据,输出数字值作为结果。如退昂识别最后以整数标签输出为结果。
而现在的端对端学习更为直接纯粹,如机器翻译:输入英语文本,输出法语文本;语音识别:输入音频,输出文本。但端对端学习需要大量的训练集。
吴恩达先讲述了常见的深度学习模型,然后再着分析端到端学习的具体应用。
二、主要的深度学习模型
普通神经网络
顺序模型 (1D 顺序) RNN, GRU, LSTM, CTC, 注意力模型
图像模型 2D 和 3D 卷积神经网络
先进/未来 技术:无监督学习(稀疏编码 ICA, SFA,)增强学习
三、端到端学习应用案例
语音识别
传统模型:语音→运算特征—(人工设计的 MFCC 特征)→音素识别器—(音素识别)→最终识别器→输出。
端到端学习:音频→学习算法→转录结果;在给定了足够的有标注数据(音频、转录结果)时,这种方法的效果会很好。
自动驾驶
传统模型:摄像头图像→检测汽车+检测行人→路径规划→方向控制。
端到端学习:摄像头图像→学习算法→方向控制。
自动驾驶对安全有极高要求,因此需要极高的精确度。采取纯粹的端到端学习十分有挑战性。只在有足够(x,y)的数据,来学习足够复杂的函数的情况下,端到端学习才有效果。
四、机器学习策略
你经常有很多改进 AI 系统的主意,应该怎么做?好的战略能避免浪费数月精力做无用的事。
以语音识别为例,可以把原语音数据分割成:
60% 训练集(训练模型)
20% 开发集(开发过程中用于调参、验证等步骤的数据集)
20% 测试集(测试时所使用的数据集)
这里面普及几个概念:
人类水平的误差与训练集的误差之间的差距是可避免的偏差,这部分误差可以通过进一步的学习/模型调整优化来避免。
训练集和开发集之间的差距称为方差,其因为跑了不同的数据从而导致误差率变化。
上述两种偏差合在一起,就是偏差-方差权衡(bias-variance trade-off)。
机器学习的基本方案
自动数据合成示例
不同训练、测试集的分布
假设你想要为一个汽车后视镜产品,开发语音识别系统。你有 5000 小时的普通语音数据,还有 10 小时的车内数据。你怎么对数据分组呢?这是一个不恰当的方式:
不同训练和测试集分配
更好的方式:让开发和测试集来自同样的分配机制。
五、机器学习新方案
普通人类、偏差、方差分析
人类的表现水平
当机器学习在处理某项任务上比人类表现还差时,你经常会看到最快的进步。
机器学习超越人后,很快就会靠近贝叶斯最优误差线。
可以依靠人类的直觉:(i)人类提供加标签的数据。(ii)进行错误分析,来理解人是怎么对样本正确处理的(iii)预估偏差/方差。比如,一项图像识别任务的训练误差 8%, 开发误差 10%,你应该怎么处理?
六、人工智能产品管理
新的监督DL算法的存在,意味着对使用 DL开发应用的团队合作,我们在重新思考工作流程。产品经理能帮助 AI 团队,优先进行最出成果的机器学习任务。比如,对于汽车噪音、咖啡馆的谈话声、低带宽音频、带口音的语音,你是应该提高语音效果呢,还是改善延迟,缩小二进制,还是做别的什么?
今天的人工智能能做什么呢?这里给产品经理一些启发:
如果一个普通人完成一项智力任务只需不到一秒的思考时间,我们很可能现在,或者不远的将来,用 AI 把该任务自动化。
对于我们观察到的具体的、重复性的事件(比如用户点击广告;快递花费的时间),我们可以合理地预测下一个事件的结果(用户是否点击下一个此类广告)。
产品经理和研究员、工程师该如何分工
七、吴恩达新书推荐
吴恩达 NIPS 2016:利用深度学习开发人工智能应用的基本要点(含唯一的中文版PPT)...相关推荐
- 吴恩达《神经网络与深度学习》精炼笔记(4)-- 浅层神经网络
上节课我们主要介绍了向量化.矩阵计算的方法和python编程的相关技巧.并以逻辑回归为例,将其算法流程包括梯度下降转换为向量化的形式,从而大大提高了程序运算速度.本节课我们将从浅层神经网络入手,开始真 ...
- 吴恩达【神经网络和深度学习】Week4——深层神经网络
文章目录 Deep Neural Network 1.Deep L-layer Neural Network 2.Forward Propagation in a Deep Network 3.Get ...
- 吴恩达《神经网络和深度学习》第四周编程作业—深度神经网络应用--Cat or Not?
吴恩达<神经网络和深度学习>- 深度神经网络应用--Cat or Not? 1 安装包 2 数据集 3 模型的结构 3.1 两层神经网络 3.2 L层深度神经网络 3.3 通用步骤 4 两 ...
- 吴恩达《神经网络与深度学习》精炼笔记(5)-- 深层神经网络
上节课我们主要介绍了浅层神经网络.首先介绍神经网络的基本结构,包括输入层,隐藏层和输出层.然后以简单的2 layer NN为例,详细推导了其正向传播过程和反向传播过程,使用梯度下降的方法优化神经网络参 ...
- 吴恩达《神经网络和深度学习》第二周编程作业—用神经网络思想实现逻辑回归
吴恩达<神经网络和深度学习>-用神经网络思想实现逻辑回归 1 安装包 2 问题概述 3 学习算法的一般架构 4 构建算法的各个部分 4.1 激活函数 4.2 初始化参数 4.3 前向和后向 ...
- 吴恩达说百度的深度学习已超越苹果和谷歌,那到底神在哪里?
嗅科技2014-12-19 16:51 人工智能 深度学习 33 7 虎嗅注:百度深度学习今日出现了里程碑性的突破,有关该项技术的信息目前披露较少,虎嗅两位作者罗超与嗅科技提供了可供了解的线索,本文对 ...
- 吴恩达老师机器学习和深度学习课程文字版下载
有人把吴恩达老师的机器学习课程和深度学习课程做成了文字版,提供pdf下载,Github获得21K+12.8Kstar! 现在提供下载! 获取方式:扫码进入公众号,回复"pdf2"即 ...
- 完结撒花!吴恩达DeepLearning.ai《深度学习》课程笔记目录总集
作者: 大树先生 博客: http://blog.csdn.net/koala_tree 知乎:https://www.zhihu.com/people/dashuxiansheng GitHub:h ...
- 永久免费!吴恩达刚公布的深度学习课程上线网易云课堂
原来中标的是网易云课堂! 6 月 23 日,吴恩达宣布离开百度三个月后的创业项目:Deeplearning.ai,8 月 8 日,吴恩达的最新课程"Deep Learning Special ...
最新文章
- hadoop磁盘空间不均衡的解决办法
- 开源大数据周刊-第15期
- Anuglar中的常用通道-大小写转换、日期转换、小数位数、Json、slice、管道链
- [jQuery基础] jQuery动效
- 电脑显示服务器负载信息失败,线上服务mcelog负载异常分析处理流程
- jsp oracle连接池,利用Oracle自带的连接池类的一例
- iOS开发中常见的性能优化技巧
- python 随机数_python项目实战:实现蒙特卡罗方法,求物体阴影面积
- Autodesk 2014 系列软件通用注册机使用方法:
- phpstorm 常用快捷键及自定义快捷键
- hashtable允许null键和值吗_HashMap 和 Hashtable 的 6 个区别,最后一个没几个人知道!...
- Unity3D 内存释放 垃圾回收
- 伟大时刻:小米的命门
- ios 现有项目接入Flutter (问题集中营--少走弯路)
- 关于安卓脚本打包apk
- 学生个人网页设计作品 学生个人网页模板 简单个人主页成品 个人网页制作 HTML学生个人网站作业设计 汉语言文学设计题材网页
- h5跨域访问图片_h5标签canvas关于getImageData跨域的问题
- 计算机视觉论文-2021-05-28
- 【看这个篇就够了】95%成为网络安全工程师
- Anaconda 安装错误的解决办法
热门文章
- codevs 4560 NOIP2015 D2T2 子串
- 对java面试文章的技术漫谈的C#技术理解
- 不用库函数求平方根!
- 企鹅帝国的疯狂反扑!
- hdu4278 小想法
- 【错误记录】Groovy 运行报错 ( Exception in thread “main“ groovy.lang.MissingMethodException: No signature of )
- 【C 语言】字符串操作 ( C 字符串 | 字符数组始化 )
- 【错误记录】PyCharm 运行 Python 程序报错 ( PEP 8: W292 no newline at end of file )
- 【数据挖掘】决策树算法简介 ( 决策树模型 | 模型示例 | 决策树算法性能要求 | 递归创建决策树 | 树根属性选择 )
- BZOJ.4160.[NEERC2009]Exclusive Access 2(状压DP Dilworth定理)