简单的二分类情形:

1、前向传播

有m个样本,每个样本有n个特征, , 每个特征的权重是, 权重向量为,偏置为b,

激活函数为sigmoid函数, 

则激活后的值为 , 大写表示向量,小写表示标量

2、反向传播

y为真实值,损失函数为 

代价函数为

, 代价函数为a, y的函数,实际上可以看作是w,b的函数

梯度下降法,对w,b进行求偏导

反向传播的简单理解:通过上面的分解,J对w的偏导,分解为J对a的偏导,a对z的偏导,z对w的偏导,一个反向链条,从J传播到w,通过误差J来修正参数w。

下面分别来求以上几个公式

= -y(1 - a) + a(1 - y)

= -y + ay + a - ay = a - y

用矩阵的形式写作:

  , X的形状是(n, m), A - Y的形状是(1, m),所以转置后为(m, 1)。最后结果的形状为(n, 1)

 , 由于所有的b相同,只需要一个标量。使用np.sum(A - Y)

最后得到w,b的反推公式:(其中为学习率,即步长)

学习笔记,神经网络和反向传播相关推荐

  1. 零基础入门深度学习(3) - 神经网络和反向传播算法

    无论即将到来的是大数据时代还是人工智能时代,亦或是传统行业使用人工智能在云上处理大数据的时代,作为一个有理想有追求的程序员,不懂深度学习(Deep Learning)这个超热的技术,会不会感觉马上就o ...

  2. 深度学习笔记三:反向传播(backpropagation)算法

    接上一篇的最后,我们要训练多层网络的时候,最后关键的部分就是求梯度啦.纯数学方法几乎是不可能的,那么反向传播算法就是用来求梯度的,用了一个很巧妙的方法. 反向传播算法应该是神经网络最基本最需要弄懂的方 ...

  3. 深度学习(4) - 神经网络和反向传播算法

    神经元 神经元和感知器本质上是一样的,只不过我们说感知器的时候,它的激活函数是阶跃函数:而当我们说神经元时,激活函数往往选择为sigmoid函数或tanh函数.如下图所示: 计算一个神经元的输出的方法 ...

  4. 【吴恩达机器学习】第五周课程精简笔记——代价函数和反向传播

    Cost Function and Backpropagation(代价函数和反向传播) 1. Cost Function Let's first define a few variables tha ...

  5. July深度学习笔记之神经网络与反向传播算法

    July深度学习笔记之神经网络与反向传播算法 一.神经网络 神经网络的大致结构如下: 大致可以分为输入层.隐藏层与输出层. 而我们可以单独拿出来一个结点,可以发现,其实它就是类似一个逻辑回归(LR), ...

  6. 深度学习与自然语言处理教程(3) - 神经网络与反向传播(NLP通关指南·完结)

    作者:韩信子@ShowMeAI 教程地址:https://www.showmeai.tech/tutorials/36 本文地址:https://www.showmeai.tech/article-d ...

  7. 深度学习与计算机视觉教程(4) | 神经网络与反向传播(CV通关指南·完结)

    作者:韩信子@ShowMeAI 教程地址:https://www.showmeai.tech/tutorials/37 本文地址:https://www.showmeai.tech/article-d ...

  8. 机器学习笔记丨神经网络的反向传播原理及过程(图文并茂+浅显易懂)

    文章目录 一.前言 二.神经网络的前向传播原理 1. 单个神经元的计算 2. 神经元在神经网络中的计算 三.反向传播算法内容(请静下心,一步一步的看) Step1 计算误差 Step2 更新权重 四. ...

  9. 独家思维导图!让你秒懂李宏毅2020深度学习(三)——深度学习基础(神经网络和反向传播部分)

    独家思维导图!让你秒懂李宏毅2020深度学习(三)--深度学习基础(神经网络和反向传播部分) 长文预警!!!前面两篇文章主要介绍了李宏毅视频中的机器学习部分,从这篇文章开始,我将介绍李宏毅视频中的深度 ...

  10. Goodfellow深度学习笔记--神经网络架构

    目录 损失函数 指标选择 交叉熵 交叉熵代码 使用最大似然的优势 损失函数的具体形式 用于高斯输出分布的线性单元 用于Bernoulli输出分布的sigmoid单元 用于Multinoulli输出分布 ...

最新文章

  1. 分享一个电视节目API接口PHP调用代码
  2. Hello World of OpenCascade
  3. iOS 完美解决 interactivePopGestureRecognizer 卡住的问题
  4. JavaScirpt类型检测函数总结
  5. 【Tools】Windows下Git 2.18安装步骤
  6. python 追加到字典_使用Python读取,写入和解析JSON
  7. 显示器驱动有什么用_科普一下:电脑显示器用什么接口好,主流接口有哪些?...
  8. pyhton读取json格式的气象数据
  9. CentOS 6.3 samba安装及配置
  10. python爬取百度迁徙数据_python爬虫-动态爬取百度迁徙
  11. JavaWeb框架学习文章索引
  12. 飞机遭遇时空乱流离奇穿越到30年前
  13. 微信朋友圈api接口调用源码
  14. JS调用OCX控件过程
  15. excel锁定单元格不能修改_Excel如何锁定部分区域不被编辑,1分钟就学会
  16. t检验自由度的意义_统计学常用概念:T检验、F检验、卡方检验、P值、自由度...
  17. CUBEMX STM32F105RB U盘读写详细教程
  18. 正则表达式 匹配美元等多种货币符号的超简单方法
  19. 如何看待阿里云要做“全球产业AI的拓荒者”?
  20. html去掉button的默认样式

热门文章

  1. Struct复杂数据类型的UDF编写、GenericUDF编写
  2. Linux中执行bash脚本报错/bin/bash^M: bad interpreter: No such file or directory
  3. Documentum 6.7 DFC client not connecting
  4. 如何解决PS“不能完成请求,因为意外的遇到文件尾”?
  5. 【转】知识图谱上推荐推理的模仿学习框架
  6. 都在说测试左移和右移,只有这篇文章说明白了
  7. FS9017R.是一款单节4.2V锂电池充电管理IC
  8. 程序员电影,荧屏里的程序员形象
  9. 《做自己人生的CEO》总结
  10. LightSwitch 社区内容汇总 – 2012年9月