深层神经网络

那么什么算是深度神经网络呢?

如图所示,我们说逻辑回归是一个浅层模型,单隐层神经网络是一个双层神经网络,注意我们数网络层数的时候一定不要把输入层数进去,只是数隐藏层的数量,以及输出层。

我们约定,输入层用

x=a[0]x=a[0]

x=a^{[0]}
表示,输出层,用

y^=a[L]y^=a[L]

\hat{y} = a^{[L]}
表示。

深层神经网络中的前向传播

如何在深度学习中正确运用正向传播和反向传播呢?

我们先看一个训练样本x的情况,之后我们再向量化到全体样本。

如图所示,这是正向传播的整个过程,左边是按照单个样本,右边是整个进行向量化表示,你会发现,这个和单层神经网络十分相似,只是多重复了几遍,事实也的确如此。

核对矩阵维数

对于深层网络而言,涉及到的运算较多,如果不注意矩阵的维数,稍有不慎就可能出错,下面说一下如何避免这个问题。

如图所示,这是单个训练样本下的矩阵维数表示。w虽然不太好推出来,但是我们知道了z和x,所以根据z和x的矩阵维数,就可以得出w矩阵维数的情况。dw和db与w和b的矩阵维数是保持一致的。

如图所示,这是矩阵形式的表示方式。这里我们不再是一个样本,而变成了m个样本。需要注意的是,图中的左下角的对每个样本进行计算的时候,仍然应当是(n[1],1)(n[1],1)(n^{[1]},1)的形式,但这里使用广播复制了m份,使得Z具有m列保持一致。

对于右侧的X我们可以看到,一个样本的维度是(n0,1)(n0,1)(n^{0},1),具有m个样本,所以是m列,因此维度变为(n0,m)(n0,m)(n^{0},m)

深层神经网络中的前向传播相关推荐

  1. 4.2 深层网络中的前向传播-深度学习-Stanford吴恩达教授

    ←上一篇 ↓↑ 下一篇→ 4.1 深层神经网络 回到目录 4.3 核对矩阵的维数 深层网络中的前向传播 (Forward Propagation in a Deep Network) 跟往常一样,我们 ...

  2. 吴恩达深度学习 —— 4.2 深层网络中的前向传播

    在下图神经网络中,假设有一个训练样本x,在第一层里需要计算z[1]=W[1]x+b[1]z^{[1]}=W^{[1]}x+b^{[1]}z[1]=W[1]x+b[1],其中W[1]W^{[1]}W[1 ...

  3. 深度学习:神经网络中的前向传播和反向传播算法推导

    1. 神经网络 这是一个常见的神经网络的图: 这是一个常见的三层神经网络的基本构成,Layer L1是输入层,Layer L2是隐含层,Layer L3是隐含层,当我们输入x1,x2,x3等数据时,通 ...

  4. 详解+推导 神经网络中的前向传播和反向传播公式(神经网络中的梯度下降)

    文章目录 线性回归快速回忆 逻辑回归中的正向传播与反向传播 逻辑回归中的正向传播与反向传播-代码实战 神经网络的正向传播与反向传播 参考资料 线性回归快速回忆 在线性回归(y=ax+by=ax+by= ...

  5. 4.3 深层网络中的前向传播

  6. 神经网络中的前向和后向算法

       看了一段时间的深度网络模型,也在tf和theano上都跑了一些模型,但是感觉没有潜下去,对很多东西的理解都只停留在"这个是干什么的"层次上面.昨天在和小老师一起看一篇文章的时 ...

  7. 神经网络理解:前向传播与反向传播

    文章目录 参考资料 神经网络 前向传播 1. 输入层->隐含层 2. 隐含层->输出层 反向传播 1. 计算总误差 2. 隐藏层与输出层之间的权重更新 3. 输入层与隐藏层之间的权重更新 ...

  8. SF BAY ACM TALK:深层神经网络中的大规模自调整

    原文:https://calculatedcontent.com/2019/04/01/sf-bay-acm-talk-heavy-tailed-self-regularization-in-deep ...

  9. 深度学习(三)——深层神经网络

    深层神经网络 深层神经网络中的前向传播 训练单个样本: 第一层: z[1]=w[1]x+b[1]a[1]=g(z[1])\begin{array}{l} {z^{[1]}} = {w^{[1]}}x ...

最新文章

  1. HTML的标签描述13
  2. java什么叫实例化_在JAVA中实例化的确切含义是什么
  3. c语言 增加 删除 修改的功能 不用链表,不用链表,单是结构体写入文件后,是否可以进行修改删除...
  4. python 字节和字符串区别,Python中字节串和字符串,不是一个概念没有区别之分...
  5. java宏定义_现代化的 Java (二十六)—— Akka Stream Graph
  6. C++拷贝构造函数的调用时机
  7. 小郡肝火锅点餐系统——项目文档
  8. (十五) 构建springmvc+mybatis+dubbo分布式平台-window安装dubbo管控台
  9. 后勤管理系统_还在用人工进行宿舍后勤管理?超级适用的宿舍管理系统推荐
  10. 安装Python3.5后,pip报错Fatal error in launcher: Unable to create process using ‘“‘解决方案
  11. word2vec原理CBOW与Skip-Gram模型基础
  12. bp神经网络训练过程matlab,bp神经网络训练时间
  13. java谜题读书笔记_《java深度历险》读书笔记(一)
  14. Keras 简介与优势
  15. 概率论与数理统计公式
  16. 一个高中生的编程自学经历
  17. 购买别人的域名回收别人废弃的域名
  18. 淘点点能否不孚众望扛起阿里O2O的大任?
  19. CP2101 usb转uart驱动
  20. 李开复写给中国大学生的第四封信

热门文章

  1. 利用vue进行页面滚动监听,上拉刷新
  2. Flutter开发环境安装
  3. WordPress制作插件中使用wp_enqueue_script('jquery')库不起作用解决方法
  4. LinkedIn公司采用超大规模数据中心设计
  5. 《Java特种兵》1.3 简单数字游戏玩一玩
  6. wxpython基本控件-静态文本控件
  7. 高等应用数学问题的matlab求解汇总
  8. c++ using namespace std; - 海明威 - 博客园
  9. MySQL事件调度器(Event Scheduler)介绍
  10. struts标签判断两个session中的字符串值是否相等