吴恩达机器学习——反向传播算法

  • 1.误差 $\delta^{(3)}$, $\delta^{(2)}$的推导
  • 2.反向传播算法的计算过程

前言:反向传播算法是用来求偏导数的,即 σJ(θ)σθij(2)\frac{\sigma{J(\theta)}}{\sigma{\theta^{(2)}_{ij}}}σθij(2)​σJ(θ)​,有了这个偏导数,就可以使用梯度下降算法或其他高级算法得出 θ\thetaθ

1.误差 δ(3)\delta^{(3)}δ(3), δ(2)\delta^{(2)}δ(2)的推导

反向传播算法中误差的计算过程:

首先,这里没有使用线性回归中的平方差来计算,而是直接定义了δ(4)=a(4)−y,即预测值减去实际值\delta^{(4)}=a^{(4)}-y,\text{即预测值减去实际值}δ(4)=a(4)−y,即预测值减去实际值

接下来我们看一下δ(3)\delta^{(3)}δ(3)的推导过程:

1.代价函数(这里我们考虑最简单的情况,k=1,并且只考虑一个训练样本(x(i)x^{(i)}x(i), y(i)y^{(i)}y(i))):
cost(i)=−y(i)∗log(h(x(i)))−(1−y(i))log(1−h(x(i)))cost(i)=-y^{(i)}*log(h(x^{(i)}))-(1-y^{(i)})log(1-h(x^{(i)}))cost(i)=−y(i)∗log(h(x(i)))−(1−y(i))log(1−h(x(i)))
2.误差计算公式:δj(l)=σcost(i)σzj(l)\delta^{(l)}_{j}=\frac{\sigma{cost(i)}}{\sigma{z^{(l)}_j}}δj(l)​=σzj(l)​σcost(i)​.
这里的误差计算公式为什么和δ(4)\delta^{(4)}δ(4)不一样呢?我们先看一下等式右边的偏导数等于多少。

【说明:上图中的y(i)y^{(i)}y(i)是实数而不是向量,因为我们这里暂时只考虑了k=1的情况。】
可以看到和δ(4)\delta^{(4)}δ(4)的定义是一样的。网上也看到其他说法:?是代价函数关于所计算出的中间项 z 的偏导数,它所衡量的是:为了影响这些中间值,我们所需要改变神经网络中的权重的程度

3.δ(3),δ(2)\delta^{(3)},\delta^{(2)}δ(3),δ(2)的推导

2.反向传播算法的计算过程


Δij(l)\Delta^{(l)}_{ij}Δij(l)​的推导过程:

吴恩达机器学习——反向传播算法相关推荐

  1. 反向传播算法推导(交叉熵代价函数-吴恩达机器学习)

    0. 前言 第一次看吴恩达老师机器学习视频时, 在9.29.29.2节卡住.看到评论区别人解答(Arch725 的解答)发现有一些疏漏,而且缺少一些铺垫,所以进行了一些修改补充. 本文的反向传播算法的 ...

  2. 吴恩达机器学习作业Python实现(四):神经网络(反向传播)

    吴恩达机器学习系列作业目录 1 Neural Networks 神经网络 在这个练习中,你将实现反向传播算法来学习神经网络的参数.依旧是上次预测手写数数字的例子. 1.1 Visualizing th ...

  3. 【吴恩达机器学习】第五周课程精简笔记——代价函数和反向传播

    Cost Function and Backpropagation(代价函数和反向传播) 1. Cost Function Let's first define a few variables tha ...

  4. 吴恩达机器学习(七)神经网络(反向传播)

    目录 0. 前言 1. 代价函数(Cost Function) 2. 反向传播(back propagation) 3. 前向传播和反向传播的结合 4. 梯度检测(gradient checking) ...

  5. 吴恩达机器学习笔记55-异常检测算法的特征选择(Choosing What Features to Use of Anomaly Detection)

    吴恩达机器学习笔记55-异常检测算法的特征选择(Choosing What Features to Use of Anomaly Detection) 对于异常检测算法,使用特征是至关重要的,下面谈谈 ...

  6. 吴恩达机器学习6——机器学习算法改进、系统设计

    吴恩达机器学习6 一.机器学习算法改进 1. 机器学习算法评价 1.1 评估模型 1.2 模型选择和交叉验证集 2. 偏差与方差 2.1 诊断偏差和方差 2.2 正则化和偏差/方差 2.3 学习曲线 ...

  7. 吴恩达机器学习(十四)推荐系统(基于梯度下降的协同过滤算法)

    目录 0. 前言 1. 基于内容的推荐算法(Content-based recommendations) 2. 计算电影特征 3. 基于梯度下降的协同过滤算法(Collaborative filter ...

  8. 吴恩达机器学习(十一)K-means(无监督学习、聚类算法)

    目录 0. 前言 1. K-means的算法流程 2. 代价函数(优化目标函数) 3. K 的选择 学习完吴恩达老师机器学习课程的无监督学习,简单的做个笔记.文中部分描述属于个人消化后的理解,仅供参考 ...

  9. 吴恩达机器学习(六)神经网络(前向传播)

    目录 0. 前言 1. 神经网络模型 2. 前向传播(forward propagation) 3. 神经网络中的多分类 学习完吴恩达老师机器学习课程的神经网络,简单的做个笔记.文中部分描述属于个人消 ...

最新文章

  1. mysql 源代码学习 博客 [lock..]
  2. 阿里P7试用期被淘汰,主管给出的理由让人意想不到
  3. python组成三位无重复数字_Python生成十万个无序且唯一的数字
  4. linux文件系统的管理方法,Linux学习笔记:2.文件系统的管理命令(2)
  5. 引用和指针的区别都有什么_C++指针与引用的区别
  6. 菜鸟Linux系列:[4]SSH免密码登陆远程服务器
  7. 信息奥赛一本通(1310:【例2.2】车厢重组)
  8. 《手把手教你》系列基础篇之1-python+ selenium自动化测试-环境搭建(详细)
  9. c# WebApi之解决跨域问题:Cors
  10. java递归用for实现_用java实现的经典递归算法
  11. 物联网开发平台快速实现ModbusRTU连接
  12. gradle系列-1-gradle -x test clean build
  13. 質量機能展開(QFD)的使用及注意事項簡析
  14. fiddler+LR11录制脚本
  15. Ubuntu18中安装Nvidia驱动和CUDA和cuDNN库加速
  16. win10连接android手机助手下载,完美win10手机助手-Win10手机助手v1.0.1 官方免费版下载_飞翔下载...
  17. 开源资产管理软件—OCS Inventory NG+ GLPI 系统安装配置UTF-8版 支持中文
  18. 无限纷争如何找到以前的服务器,无限纷争远古遗迹及幻境冒险玩法详细讲解
  19. GDAL Python读取.pbf文件
  20. 三位共阴数码管动态显示按键控制加减

热门文章

  1. Mac 2020版M1 安装虚拟机各种踩坑详解(关注文末小惊喜哟)
  2. 山东大学程序设计思维实践- TT与可怜的猫
  3. 彻底解决CUDA安装_ 被坑的几个要点
  4. java 读取ascii码_JAVA ASCII码 读入字符串测试
  5. 复旦大学2015--2016学年第二学期高等代数II期末考试情况分析
  6. 富文本样式文字图片处理
  7. ElementUI 树形结构默认展示某个节点
  8. 内存小实用的手机浏览器,这2款无广告,功能不输UC
  9. UEFI原理与编程实践--UEFI系统的启动过程
  10. 物质、分子、原子、原子核、中子、质子、电子、量子、离子的区别