←上一篇 ↓↑ 下一篇→
1.1 欢迎 回到目录 1.3 用神经网络进行监督学习

什么是神经网络

我们常常用深度学习这个术语来指训练神经网络的过程。有时它指的是特别大规模的神经网络训练。那么神经网络究竟是什么呢?在这个视频中,我会讲解一些直观的基础知识。

让我们从一个房价预测的例子开始讲起。

假设你有一个数据集,它包含了六栋房子的信息。所以,你知道房屋的面积是多少平方英尺或者平方米,并且知道房屋价格。这时,你想要拟合一个根据房屋面积预测房价的函数。

如果你对线性回归很熟悉,你可能会说:“好吧,让我们用这些数据拟合一条直线。”于是你可能会得到这样一条直线。

但有点奇怪的是,你可能也发现了,我们知道价格永远不会是负数的。因此,为了替代一条可能会让价格为负的直线,我们把直线弯曲一点,让它最终在零结束。这条粗的蓝线最终就是你的函数,用于根据房屋面积预测价格。有部分是零,而直线的部分拟合的很好。你也许认为这个函数只拟合房屋价格。

作为一个神经网络,这几乎可能是最简单的神经网络。我们把房屋的面积作为神经网络的输入(我们称之为xxx),通过一个节点(一个小圆圈),最终输出了价格(我们用yyy表示)。其实这个小圆圈就是一个单独的神经元。接着你的网络实现了左边这个函数的功能。

在有关神经网络的文献中,你经常看得到这个函数。从趋近于零开始,然后变成一条直线。这个函数被称作ReLU激活函数,它的全称是Rectified Linear Unit。rectify(修正)可以理解成max(0,x)max(0,x)max(0,x),这也是你得到一个这种形状的函数的原因。

你现在不用担心不理解ReLU函数,你将会在这门课的后面再次看到它。

如果这是一个单神经元网络,不管规模大小,它正是通过把这些单个神经元叠加在一起来形成。如果你把这些神经元想象成单独的乐高积木,你就通过搭积木来完成一个更大的神经网络。

让我们来看一个例子,我们不仅仅用房屋的面积来预测它的价格,现在你有了一些有关房屋的其它特征,比如卧室的数量,或许有一个很重要的因素,一家人的数量也会影响房屋价格,这个房屋能住下一家人或者是四五个人的家庭吗?而这确实是基于房屋大小,以及真正决定一栋房子是否能适合你们家庭人数的卧室数。

换个话题,你可能知道邮政编码或许能作为一个特征,告诉你步行化程度。比如这附近是不是高度步行化,你是否能步行去杂货店或者是学校,以及你是否需要驾驶汽车。有些人喜欢居住在以步行为主的区域,另外根据邮政编码还和富裕程度相关(在美国是这样的)。但在其它国家也可能体现出附近学校的水平有多好。

在图上每一个画的小圆圈都可以是ReLU的一部分,也就是指修正线性单元,或者其它稍微非线性的函数。基于房屋面积和卧室数量,可以估算家庭人口,基于邮编,可以估测步行化程度或者学校的质量。最后你可能会这样想,这些决定人们乐意花费多少钱。

对于一个房子来说,这些都是与它息息相关的事情。在这个情景里,家庭人口、步行化程度以及学校的质量都能帮助你预测房屋的价格。以此为例,xxx 是所有的这四个输入,yyy 是你尝试预测的价格,把这些单个的神经元叠加在一起,我们就有了一个稍微大一点的神经网络。这显示了神经网络的神奇之处,虽然我已经描述了一个神经网络,它可以需要你得到房屋面积、步行化程度和学校的质量,或者其它影响价格的因素。

神经网络的一部分神奇之处在于,当你实现它之后,你要做的只是输入 xxx,就能得到输出 yyy。因为它可以自己计算你训练集中样本的数目以及所有的中间过程。所以,你实际上要做的就是:这里有四个输入的神经网络,这输入的特征可能是房屋的大小、卧室的数量、邮政编码和区域的富裕程度。给出这些输入的特征之后,神经网络的工作就是预测对应的价格。同时也注意到这些被叫做隐藏单元圆圈,在一个神经网络中,它们每个都从输入的四个特征获得自身输入,比如说,第一个结点代表家庭人口,而家庭人口仅仅取决于 x1x_1x1​ 和 x2x_2x2​ 特征,换句话说,在神经网络中,你决定在这个结点中想要得到什么,然后用所有的四个输入来计算想要得到的。因此,我们说输入层和中间层被紧密的连接起来了。

值得注意的是神经网络给予了足够多的关于 xxx 和 yyy 的数据,给予了足够的训练样本有关 xxx 和 yyy 。神经网络非常擅长计算从 xxx 到 yyy 的精准映射函数。

这就是一个基础的神经网络。你可能发现你自己的神经网络在监督学习的环境下是如此的有效和强大,也就是说你只要尝试输入一个 xxx ,即可把它映射成 yyy ,就好像我们在刚才房价预测的例子中看到的效果。

在下一个视频中,让我们复习一下更多监督学习的例子,有些例子会让你觉得你的网络会十分有用,并且你实际应用起来也是如此。

课程板书





←上一篇 ↓↑ 下一篇→
1.1 欢迎 回到目录 1.3 用神经网络进行监督学习

1.2 什么是神经网络-深度学习第一课《神经网络与深度学习》-Stanford吴恩达教授相关推荐

  1. 0.0 目录-深度学习第五课《序列模型》-Stanford吴恩达教授

    文章目录 目录 第五课 第四课 第三课 第二课 第一课 目录 第五课 <序列模型> 笔记列表 Week 1 循环序列模型 Week 1 传送门 -> 1.1 为什么选择序列模型 1. ...

  2. 3.1 基础模型-深度学习第五课《序列模型》-Stanford吴恩达教授

    基础模型 (Basic Model) 在这一周,你将会学习seq2seq(sequence to sequence)模型,从机器翻译到语音识别,它们都能起到很大的作用,从最基本的模型开始.之后你还会学 ...

  3. 2.5 学习词嵌入-深度学习第五课《序列模型》-Stanford吴恩达教授

    学习词嵌入 (Learning Word Embeddings) 在本节视频中,你将要学习一些具体的算法来学习词嵌入.在深度学习应用于学习词嵌入的历史上,人们一开始使用的算法比较复杂,但随着时间推移, ...

  4. 1.3 循环神经网络模型-深度学习第五课《序列模型》-Stanford吴恩达教授

    ←上一篇 ↓↑ 下一篇→ 1.2 数学符号 回到目录 1.4 通过时间的方向传播 循环神经网络模型 (Recurrent Neural Network Model) 上节视频中,你了解了我们用来定义序 ...

  5. 1.4 通过时间的反向传播-深度学习第五课《序列模型》-Stanford吴恩达教授

    ←上一篇 ↓↑ 下一篇→ 1.3 循环神经网络 回到目录 1.5 不同类型的循环神经网络 通过时间的反向传播 (Backpropagation through time) 之前我们已经学过了循环神经网 ...

  6. 1.12 深层循环神经网络-深度学习第五课《序列模型》-Stanford吴恩达教授

    ←上一篇 ↓↑ 下一篇→ 1.11 双向神经网络 回到目录 1.13 总结 深层循环神经网络 (Deep RNNs) 目前你学到的不同RNN的版本,每一个都可以独当一面.但是要学习非常复杂的函数,通常 ...

  7. 1.11 双向循环神经网络-深度学习第五课《序列模型》-Stanford吴恩达教授

    ←上一篇 ↓↑ 下一篇→ 1.10 长短期机器 (LSTM) 回到目录 1.12 深层循环神经网络 双向循环神经网络 (Bidirectional RNN) 现在,你已经了解了大部分RNN模型的关键的 ...

  8. 1.8 循环神经网络的梯度消失-深度学习第五课《序列模型》-Stanford吴恩达教授

    ←上一篇 ↓↑ 下一篇→ 1.7 对新序列采样 回到目录 1.9 GRU 单元 循环神经网络的梯度消失 (Vanishing Gradient with RNNs) 你已经了解了RNN时如何工作的了, ...

  9. 3.8 注意力模型-深度学习第五课《序列模型》-Stanford吴恩达教授

    注意力模型 (Attention Model) 在上个视频中你已经见到了,注意力模型如何让一个神经网络只注意到一部分的输入句子.当它在生成句子的时候,更像人类翻译.让我们把这些想法转化成确切的式子,来 ...

  10. 3.7 注意力模型直观理解-深度学习第五课《序列模型》-Stanford吴恩达教授

    注意力模型直观理解 (Attention Model Intuition) 在本周大部分时间中,你都在使用这个编码解码的构架(a Encoder-Decoder architecture)来完成机器翻 ...

最新文章

  1. Xmodem恢复交换机IOS
  2. 关于字符串中函数的实现( C语言 )
  3. CVPR2021-PaperWithCode
  4. 裸机中代码书写的细节总结
  5. wordpress个人博客小程序带流量主+教程
  6. 《Effective C#》Item 20:区分接口实现与虚函数重载
  7. DiscuzNT改造-远程图片自动采集-DNT2.5(自动采集、源码下载)
  8. linux access函数报错,详解汇编语言MOV指令
  9. vivado2019.2安装+license添加教程
  10. 如何通过linux的终端命令远程登陆windows主机
  11. 【JUC】008-Stream流式计算
  12. 【FFMpeg】源码编译
  13. php随机码生成有数字英文,用php生成一个可选位数的数字和英文随机码
  14. frp实现花生壳+阿里云内网穿透,实现公有IP映射到本地(支持 TCP、UDP、HTTP、HTTPS 等多种协议)
  15. pid温度控制c语言程序及仿真,pid算法温度控制c语言程序
  16. ICD建模功能约束(详见DL/T860.73附录B)
  17. 瑞星微 AI情况简介
  18. 域名可以转让注册人吗_域名转让和过户需要的资料
  19. golang 编码转换 gbk
  20. 从零开始,教你如何破解WEP、WPA无线网络 密码

热门文章

  1. Kubernetes中的nodePort,targetPort,port的区别和意义
  2. nginx负载均衡的策略
  3. ASP.NET WebApi 基于分布式Session方式实现Token签名认证
  4. 修改Tomcat可支持get传参方式的url长度,get形式
  5. Python学习笔记-2017.5.4thon学习笔记-2017.8.14
  6. [BZOJ1072][SCOI2007]排列perm
  7. Xcode6的 实时渲染 在storyboard修改自定义属性
  8. 光棍的好处(漫画)-推荐. 节日快乐~~
  9. DirectX SDK 9.28版本安装错误S1023
  10. Win32下内存分配简单示例 - 使用CFree