一. 反向传播算法

1. BP算法自然语言描述

  概念:梯度下降是利用损失函数的梯度,来决定最终的下降方向。反向传播算法是计算复杂梯度的方式。数学原理就是链式法则。
  梯度向量中每一项,不光告诉我们每个参数增加还是缩小。并且指出了每个参数的“性价比

  我们从单样本训练进行观察。

  输入的特征为784个,两层隐藏层,输出层为类别,10个节点。输出的目标为识别为2,我们看到输出层的激活值因为网络还没有训练好,值非常的随机。我们都是希望正确分类的激活值应该最大,其他的接近于0.。而激活值是由输入值权重来决定的。第一次训练的时候权重偏置都是随机设置的,那如何进行更改?
  我们最简单的方式去考虑,激活值变动,应该和当前的目标值之间的误差成正比。目前2的激活值为0.2,距离输出值1差距很大,而8的激活值为0.2,距离输出值0差距很小。所以增加2的激活值要比8更大一些。
  输出分类为2的激活函数如下图所示

  根据式子我们可以看出,增大权重、增大偏置、调整上一层的激活值。可以增加当前的激活值。
  1) 如何调整权重和偏置?
  (1) 因为偏置没有输入,只作用与当前的神经元,所以可以正比当前值和目标值之间的差来进行调整。
  (2) 权重作用于上一层神经元和下一层神经元之间的连线,反应了连接的强弱,所以上层的激活值越大,那权重对当前的神经元激活值的影响就是巨大的。所以应该正比于关联的上层激活值调整参数。
  2) 如何改变上层的激活值?
  (1) 因为权重带有正负,而激活函数如果是sigmoid和ReLU函数,那么激活值一定是大于等于0的,所以想要增加当前的激活值,应该使正权连接的上层激活值增加,负权连接的上层函数激活值减少。
  (2) 上层激活值的大小也是有上层的权重和偏置还有激活值决定。
2. 反向传播
  1) 通过上面我们理解到,改变输出神经元的激活值,需要改变上层的神经元激活值已经权重和偏置,但是在单样本训练的过程中,出了增加正确的神经元激活值,还要降低错误的神经元激活值,其他输出神经元也会改变上层的参数值,因此,要将这些神经元的期待全部求和,作为最终的改变上层神经元参数的指示。

  2) 综合来说,反向传播的理解就是这样,将所有的期待改变相加,得到对上层改动的变化量,重复这个过程直到第一层。
  3) 实际训练中,是需要同时考虑每个样本对权重与偏置的修改,然后对他们的期望进行平均,作为每个参数的变化量。最终得到的向量就是梯度下降中的负梯度。η 表示倍数。

3. BP算法总结
  1) 反向传播算法计算的是单个训练样本对所有权重和偏置的调整,包括每个参数的正负变化和变化的比例。可以最快的降低损失。
  2) 梯度下降需要对训练集中的每个样本都要进行反省传播,计算说有的平均变化值,然后进行更新。这样做的缺点是会使算法的复杂度和训练样本的数量相关。
  3) 所以最终我们实践时,会使用随机梯度下降。
    (1) 首先是将训练样本打乱
    (2) 然后将所有样本分发到mini-batch中,mini-batch的大小自己决定
    (3) 计算每个mini-batch的梯度,调整参数
    (4) 直到达到某个阈值,或者loss值不再改变
    神经网络最终将会收敛到某个局部最小值上

PS:下一篇将讲解BP算法数学原理

参考:https://github.com/imhuay/Algorithm_Interview_Notes-Chinese/blob/master/A-深度学习/A-深度学习基础.md

10分钟快速理解反向传播算法相关推荐

  1. 如何理解反向传播算法

    如何理解反向传播算法 如何理解反向传播算法 神经网络模型的数学表示 对代价函数的基本假设 反向传播算法 反向传播的直观理解 总结 参考文献 对于一个算法或者模型的理解可以分为直观理解,算法理解和数学证 ...

  2. 100天搞定机器学习|day37 无公式理解反向传播算法之精髓

     100天搞定机器学习(Day1-34) 100天搞定机器学习|Day35 深度学习之神经网络的结构 100天搞定机器学习|Day36 深度学习之梯度下降算法 本篇为100天搞定机器学习之第37天,亦 ...

  3. 吴恩达机器学习笔记 —— 10 神经网络参数的反向传播算法

    http://www.cnblogs.com/xing901022/p/9350271.html 本篇讲述了神经网络的误差反向传播以及训练一个神经网络模型的流程 更多内容参考 机器学习&深度学 ...

  4. 快速计算梯度的魔法--反向传播算法

    一.实验介绍 1.1 实验内容 第一次实验最后我们说了,我们已经学习了深度学习中的模型model(神经网络).衡量模型性能的损失函数和使损失函数减小的学习算法learn(梯度下降算法),还了解了训练数 ...

  5. 反向传播算法_9.3 反向传播算法的直观理解 Backpropagation Intuition

    在上一节中,我们介绍了反向传播算法,对很多人来说,当第一次看到这种算法时,第一印象通常是,这个算法需要那么多繁杂的步骤,简直是太复杂了,实在不知道这些步骤,到底应该如何合在一起使用.就好像一个黑箱,里 ...

  6. php梯度区间计算,快速计算梯度的魔法--反向传播算法

    2.1 计算梯度的数值方法 第一次实验我留的一个课后作业里问你是否能够想出一个求解梯度的办法,其实不难想到一种简单的办法就是使用"数值法"计算梯度. 办法很简单,就是对于损失函数中 ...

  7. 反向传播算法最全解读,机器学习进阶必看!

    如果对人工智能稍有了解的小伙伴们,或多或少都听过反向传播算法这个名词,但实际上BP到底是什么?它有着怎样的魅力与优势?本文发布于 offconvex.org,作者 Sanjeev Arora与 Ten ...

  8. 吴恩达机器学习 7.神经网络参数的反向传播算法

    1.神经网络算法的代价函数 标记方法 神经网络的训练样本有m个 每个包含一组输入x和一组输出信号y L表示神经网络层数 SIS_ISI​表示每层的神经元个数 SlS_lSl​表示输出层的神经元个数 S ...

  9. 基于DL的计算机视觉(5)--理解反向传播

    1. 引言 其实一开始要讲这部分内容,我是拒绝的,原因是我觉得有一种写高数课总结的感觉.而一般直观上理解反向传播算法就是求导的一个链式法则而已.但是偏偏理解这部分和其中的细节对于神经网络的设计和调整优 ...

最新文章

  1. Java中创建String的两种方式差异
  2. Elasticsearch索引迁移的三种方式
  3. php中intval函数用法,php intval函数用法总结
  4. git暂存工作区stash
  5. dev gridcontrol 单元格内容复制_Excel中的复制粘贴,不只是你想的那么简单的
  6. Oracle下sqlplus无法使用命令退格删除和历史记录的解决方法--使用rlwrap
  7. 解析IEC 61850通信规约
  8. OpenGL ES glew 下载和使用
  9. 读取视频文件python-opencv
  10. 微信公众号自定义菜单添加emoji表情图标
  11. 如何在spring事务提交成功后再进行异步操作
  12. 2018------书籍电影和音乐
  13. win10系统日志显示不可用sid_小编处理win10系统启用或禁用日志的处理办法
  14. iFunk S机械键盘游戏本登陆苏宁
  15. python-坦克大战游戏项目
  16. 结果填空:马的管辖(超详解版)
  17. linux链接库查找的优先顺序
  18. NLP:《NLP Year in Review 2019NLP_2019_Highlights》2019年自然语言处理领域重要进展回顾及其解读
  19. 生产环境Redis连接,长时间无响应被服务器断开问题
  20. 易福门PF2054齐平式压力传感器

热门文章

  1. 表情包(CoreIDRAW)
  2. 详解曼哈顿距离欧式距离切比雪夫距离
  3. 高人指点 linux 学习之路
  4. java写字板_java经典写字板程序
  5. python中元组的值可变吗_python中对象的可变与不可变
  6. linux 地址重定向,Linux重定向(输入输出重定向)详解
  7. mysql详解之redolog的关键——幂等性
  8. 面试题 请简述vue双向数据绑定原理
  9. 7.5 空间直线及其方程
  10. Sliverlight常见错误集锦