←上一篇	↓↑	下一篇→
2.19 总结习题	回到目录	3.2 神经网络表示

神经网络概览 (Neural Networks Overview)

本周你将学习如何实现一个神经网络。在我们深入学习具体技术之前，我希望快速的带你预览一下本周你将会学到的东西。如果这个视频中的某些细节你没有看懂你也不用担心，我们将在后面的几个视频中深入讨论技术细节。

现在我们开始快速浏览一下如何实现神经网络。上周我们讨论了逻辑回归，我们了解了这个模型如何与下面公式建立联系。

xwb}→z=wTx+b\left.\begin{matrix} x \\ w \\ b \end{matrix}\right\}\rightarrow z=w^Tx+bxwb⎭⎬⎫→z=wTx+b

如上所示，首先你需要输入特征 xxx ，参数 www 和 bbb ，通过这些你就可以计算出 zzz ，

xwb}→z=wTx+b→a=σ(z)→L(a,y)\left.\begin{matrix} x \\ w \\ b \end{matrix}\right\}\rightarrow z=w^Tx+b\rightarrow a=\sigma(z) \\ \rightarrow L(a,y)xwb⎭⎬⎫→z=wTx+b→a=σ(z)→L(a,y)

接下来使用就可以计算出 aaa 。我们将的符号换为表示输出 y^→a=σ(z)\hat{y}\rightarrow a=\sigma(z)y^→a=σ(z) ,然后可以计算出loss function L(a,y)L(a,y)L(a,y)

神经网络看起来是如下这个样子。正如我之前已经提到过，你可以把许多sigmoid单元堆叠起来形成一个神经网络。对于图3.1.1中的节点，它包含了之前讲的计算的两个步骤：首先通过公式3.1计算出值 zzz ，然后通过 σ(z)\sigma(z)σ(z) 计算值 aaa 。

在这个神经网络（图3.1.2）对应的3个节点，首先计算第一层网络中的各个节点相关的数 z[1]z^{[1]}z[1] ，接着计算 a[1]a^{[1]}a[1] ，在计算下一层网络同理；我们会使用符号 [m]^{[m]}[m] 表示第 mmm 层网络中节点相关的数，这些节点的集合被称为第 mmm 层网络。这样可以保证 [m]^{[m]}[m] 不会和我们之前用来表示单个的训练样本的 (i)^{(i)}(i) (即我们使用表示第 iii 个训练样本)混淆；整个计算过程，公式如下: 公式3.3：

xW[1]b[1]}→z[1]=W[1]x+b[1]→a[1]=σ(z[1])\left.\begin{matrix} x \\ W^{[1]} \\ b^{[1]} \end{matrix}\right\}\rightarrow z^{[1]}=W^{[1]}x+b^{[1]}\rightarrow a^{[1]}=\sigma(z^{[1]})xW[1]b[1]⎭⎬⎫→z[1]=W[1]x+b[1]→a[1]=σ(z[1])

公式3.4：

a[1]=σ(z[1])W[2]b[2]}→z[2]=W[2]a[1]+b[2]→a[2]=σ(z[2])→L(a[2],y)\left.\begin{matrix} a^{[1]}=\sigma(z^{[1]}) \\ W^{[2]} \\ b^{[2]} \end{matrix}\right\}\rightarrow z^{[2]}=W^{[2]}a^{[1]}+b^{[2]}\rightarrow a^{[2]}=\sigma(z^{[2]})\\\rightarrow L(a^{[2]},y)a[1]=σ(z[1])W[2]b[2]⎭⎬⎫→z[2]=W[2]a[1]+b[2]→a[2]=σ(z[2])→L(a[2],y)

类似逻辑回归，在计算后需要使用计算，接下来你需要使用另外一个线性方程对应的参数计算 z[2]z^{[2]}z[2] ，计算 a[2]a^{[2]}a[2] ，此时 a[2]a^{[2]}a[2] 就是整个神经网络最终的输出，用 y^\hat{y}y^ 表示网络的输出。

公式3.5：

da[1]=dσ(z[1])dW[2]db[2]}→dz[2]=d(W[2]a[1]+b[2])→da[2]=dσ(z[2])→dL(a[2],y)\left.\begin{matrix} da^{[1]}=d\sigma(z^{[1]}) \\ dW^{[2]} \\ db^{[2]} \end{matrix}\right\}\rightarrow dz^{[2]}=d(W^{[2]}a^{[1]}+b^{[2]})\rightarrow da^{[2]}=d\sigma(z^{[2]})\\\rightarrow dL(a^{[2]},y)da[1]=dσ(z[1])dW[2]db[2]⎭⎬⎫→dz[2]=d(W[2]a[1]+b[2])→da[2]=dσ(z[2])→dL(a[2],y)

我知道这其中有很多细节，其中有一点非常难以理解，即在逻辑回归中，通过直接计算 zzz 得到结果 aaa 。而这个神经网络中，我们反复的计算 zzz 和 aaa ，计算 aaa 和 zzz ，最后得到了最终的输出loss function。

你应该记得逻辑回归中，有一些从后向前的计算用来计算导数 da、dzda、dzda、dz 。同样，在神经网络中我们也有从后向前的计算，看起来就像这样，最后会计算 da[2]、dz[2]da^{[2]}、dz^{[2]}da[2]、dz[2] ，计算出来之后，然后计算 dW[2]、db[2]dW^{[2]}、db^{[2]}dW[2]、db[2] 等，按公式3.4、3.5箭头表示的那样，从右到左反向计算。

现在你大概了解了一下什么是神经网络，基于逻辑回归重复使用了两次该模型得到上述例子的神经网络。我清楚这里面多了很多新符号和细节，如果没有理解也不用担心，在接下来的视频中我们会仔细讨论具体细节。

那么，下一个视频讲述神经网络的表示。

课程PPT

←上一篇	↓↑	下一篇→
2.19 总结习题	回到目录	3.2 神经网络表示

3.1 神经网络概览-深度学习-Stanford吴恩达教授相关推荐

3.2 神经网络表示-深度学习-Stanford吴恩达教授
←上一篇 ↓↑ 下一篇→ 3.1 神经网络概览回到目录 3.3 计算神经网络的输出神经网络表示 (Neural Network Representation) 先回顾一下我在上一个视频画几张神经网 ...
4.5 搭建深层神经网络块-深度学习-Stanford吴恩达教授
←上一篇 ↓↑ 下一篇→ 4.4 为什么使用深层表示回到目录 4.6 前向和反向传播搭建深层神经网络块 (Building Blocks of Deep Neural Networks) 这周的前 ...
2.19 总结-深度学习-Stanford吴恩达教授
←上一篇 ↓↑ 下一篇→ 2.18 Logistic 损失函数的解释回到目录 3.1 神经网络概览文章目录总结习题第 11 题第 12 题第 13 题第 14 题第 15 题第 1 ...
3.12 总结-深度学习-Stanford吴恩达教授
←上一篇 ↓↑ 下一篇→ 3.11 随机初始化回到目录 4.1 深层神经网络文章目录总结习题第 21 题第 22 题第 23 题第 24 题第 25 题第 26 题第 27 题 ...
3.5 向量化实现的解释-深度学习-Stanford吴恩达教授
←上一篇 ↓↑ 下一篇→ 3.4 多个例子中的向量化回到目录 3.6 激活函数向量化实现的解释 (Explanation for Vectorized Implementation) 在上一个视频 ...
2.5 导数-深度学习-Stanford吴恩达教授
←上一篇 ↓↑ 下一篇→ 2.4 梯度下降法回到目录 2.6 更多导数的例子导数 (Derivatives) 这个视频我主要是想帮你获得对微积分和导数直观的理解.或许你认为自从大学毕以后你再也没有 ...
1.5 关于这门课-深度学习-Stanford吴恩达教授
←上一篇 ↓↑ 下一篇→ 1.4 为什么深度学习会兴起回到目录 1.6 课程资源关于这门课你的学习进度已经快接近这个专项课程的第一门课的第一周结尾了,首先,快速地介绍一下下周的学习内容: 在第一 ...
3.10 直观理解反向传播-深度学习-Stanford吴恩达教授
←上一篇 ↓↑ 下一篇→ 3.9 神经网络的梯度下降法回到目录 3.11 随机初始化直观理解反向传播 (Backpropagation Intuition (Optional)) 这个视频主要是推 ...
4.1 深层神经网络-深度学习-Stanford吴恩达教授
←上一篇 ↓↑ 下一篇→ 3.12 总结习题回到目录 4.2 深层网络中的前向传播深层神经网络 (Deep L-layer Neural Network) 目前为止我们学习了只有一个单独隐藏层的神 ...

3.1 神经网络概览-深度学习-Stanford吴恩达教授

神经网络概览 (Neural Networks Overview)

课程PPT

3.1 神经网络概览-深度学习-Stanford吴恩达教授相关推荐

最新文章

热门文章