Neural Networks:Learning

Cost function

逻辑回归代价函数:
J(θ)=−1m∑i=1m(y(i)log⁡(hθ(x(i)))+(1−y(i))log⁡(1−hθ(x(i))))+λ2m∑j=1mθj2J(\theta)=-\frac{1}{m}\sum_{i=1}^{m}(y^{(i)}\log(h_\theta(x^{(i)}))+(1-y^{(i)})\log(1-h_\theta(x^{(i)})))+\frac{\lambda}{2m}\sum_{j=1}^{m}\theta_j^2 J(θ)=−m1​i=1∑m​(y(i)log(hθ​(x(i)))+(1−y(i))log(1−hθ​(x(i))))+2mλ​j=1∑m​θj2​
神经网络代价函数:
J(θ)=−1m∑i=1m∑k=1K(yk(i)log⁡(hθ(x(i)))k+(1−yk(i))log⁡(1−hθ(x(i)))k)+λ2m∑l=1L−1∑j=1m∑i=1m(θjil)2J(\theta)=-\frac{1}{m}\sum_{i=1}^{m}\sum_{k=1}^{K}(y_k^{(i)}\log(h_\theta(x^{(i)}))_k+(1-y_k^{(i)})\log(1-h_\theta(x^{(i)}))_k)+\frac{\lambda}{2m}\sum_{l=1}^{L-1}\sum_{j=1}^{m}\sum_{i=1}^{m}(\theta_{ji}^{l})^2J(θ)=−m1​i=1∑m​k=1∑K​(yk(i)​log(hθ​(x(i)))k​+(1−yk(i)​)log(1−hθ​(x(i)))k​)+2mλ​l=1∑L−1​j=1∑m​i=1∑m​(θjil​)2

反向传播算法:Backpropagation algorithm


反向传播:
intution:δj(l)\delta_j^{(l)}δj(l)​=“error” of node j in layer l.
计算:δj(l)\delta_j^{(l)}δj(l)​ =第 l层第 j个节点的误差(error);
对于每一个输出单元:δj(4)=aj(4)−yj\delta_j^{(4)}=a_j^{(4)}-y_jδj(4)​=aj(4)​−yj​ ​,
写成向量形式为:δ(4)=a(4)−y\delta^{(4)}=a^{(4)}-yδ(4)=a(4)−y ;
由输出层逐级往上计算 δ(l)、δ(l−1)…δ(2)\delta^{(l)}、\delta^{(l-1)}\dots \delta^{(2)}δ(l)、δ(l−1)…δ(2)
δ(3)=(Θ(3))Tδ(4).∗g′(z(3)),g′(z(3))=a(3).∗(1−a(3))δ(2)=(Θ(2))Tδ(3).∗g′(z(2)),g′(z(2))=a(2).∗(1−a(2))\delta^{(3)}=(\Theta^{(3)})^T\delta^{(4)}.*g\prime(z^{(3)}),\qquad g\prime(z^{(3)})=a^{(3)}.*(1-a^{(3)}) \\ \delta^{(2)}=(\Theta^{(2)})^T\delta^{(3)}.*g\prime(z^{(2)}),\qquad g\prime(z^{(2)})=a^{(2)}.*(1-a^{(2)})δ(3)=(Θ(3))Tδ(4).∗g′(z(3)),g′(z(3))=a(3).∗(1−a(3))δ(2)=(Θ(2))Tδ(3).∗g′(z(2)),g′(z(2))=a(2).∗(1−a(2))
可以证明(忽略 λ ,即 λ = 0):∂∂Θij(l)J(Θ)=aj(l)δi(l+1)\frac{\partial}{\partial\Theta_{ij}^{(l)}}J(\Theta)=a_j^{(l)}\delta_i^{(l+1)} ∂Θij(l)​∂​J(Θ)=aj(l)​δi(l+1)​

原文链接:https://blog.csdn.net/qq_29317617/article/details/86312154

理解反向传播算法:Backpropagation intitutio

具体过程:

向前传播:
换句话说: δj(l)=∂∂zj(l)cost(i)for(j≥0)\delta_j^{(l)}=\frac{\partial}{\partial z_{j}^{(l)}}cost(i) for(j\geq0) δj(l)​=∂zj(l)​∂​cost(i)for(j≥0)
where cost(i)=y(i)log⁡(hθ(x(i)))+(1−y(i))log⁡(1−hθ(x(i)))cost(i)=y^{(i)}\log(h_\theta(x^{(i)}))+(1-y^{(i)})\log(1-h_\theta(x^{(i)}))cost(i)=y(i)log(hθ​(x(i)))+(1−y(i))log(1−hθ​(x(i)))
δ项是代价函数关于这些中间项的偏导数,衡量影响神经网络的权值,进而影响神经网络的输出的程度。

展开参数:Implementation note:Unrolling parameters


梯度检验:Gradient checking



实现注意:

随机初始化:Random initialization

zero initialization:
After each update, parameters corresponding to inputs going into each oftwo hidden units are identical.
如果初始化为0,每次更新后,输入到两个隐藏单元中的输入对应的参数是相同的。

随机初始化:

组合到一起:Putting it together


吴恩达机器学习笔记(七)神经网络:代价函数相关推荐

  1. 吴恩达机器学习笔记week8——神经网络 Neutral network

    吴恩达机器学习笔记week8--神经网络 Neutral network 8-1.非线性假设 Non-linear hypotheses 8-2.神经元与大脑 Neurons and the brai ...

  2. 吴恩达机器学习笔记 —— 10 神经网络参数的反向传播算法

    http://www.cnblogs.com/xing901022/p/9350271.html 本篇讲述了神经网络的误差反向传播以及训练一个神经网络模型的流程 更多内容参考 机器学习&深度学 ...

  3. 吴恩达机器学习笔记 —— 9 神经网络学习

    http://www.cnblogs.com/xing901022/p/9344621.html 本章讲述了神经网络的起源与神经元模型,并且描述了前馈型神经网络的构造. 更多内容参考 机器学习& ...

  4. 【Nan‘s 吴恩达机器学习笔记】第八、九章 神经网络

    [Nan's 吴恩达机器学习笔记]第八.九章 神经网络 神经网络(Neural Networks) 8.1 非线性假设 8.2 模型表示 前向传播算法(Forward Propagation) 8.3 ...

  5. 吴恩达机器学习笔记整理(Week6-Week11)

    1. Week 6 1.1 应用机器学习的建议(Advice for Applying Machine Learning) 1.1.1 决定下一步做什么 到目前为止,我们已经介绍了许多不同的学习算法, ...

  6. 吴恩达机器学习笔记整理(Week1-Week5)

    吴恩达机器学习笔记整理 1. Week1 1.1 什么是机器学习(What is Machine Learning) 1.2机器学习算法分类 1.3 单变量线性回归(Linear Regression ...

  7. 吴恩达机器学习笔记:(一)机器学习方法简介

    吴恩达机器学习笔记 Supervised Learning(监督学习) Unsupervised Learning(无监督学习) clustering 聚类算法 market segments 市场细 ...

  8. 吴恩达机器学习笔记第一周

    第一周 吴恩达机器学习笔记第一周 一. 引言(Introduction) 1.1 欢迎 1.2 机器学习是什么? 1.3 监督学习 1.4 无监督学习 二.单变量线性回归(Linear Regress ...

  9. 【经典】吴恩达——机器学习笔记001

    [经典]吴恩达--机器学习笔记001 机器学习(Machine Learning)笔记001 学习地址:[中英字幕]吴恩达机器学习系列课程 文字版参考及PPT来源:Coursera-ML-Andrew ...

  10. 吴恩达机器学习笔记55-异常检测算法的特征选择(Choosing What Features to Use of Anomaly Detection)

    吴恩达机器学习笔记55-异常检测算法的特征选择(Choosing What Features to Use of Anomaly Detection) 对于异常检测算法,使用特征是至关重要的,下面谈谈 ...

最新文章

  1. Unity3D开发赛车Demo遇到的问题
  2. Mybatis 工作总结 持续更新
  3. 使用littleTools简化docker/kubectl的命令
  4. 工具用途_德普优化使用指南:16个工具的功能及用途(工具文)
  5. SQL 注入工具集合
  6. 新建notebook时发现在notebook里的sys.path与电脑上不一样
  7. VS2013出现“无法找到“xxx.exe”的调试信息,或者调试信息不匹配”错误解决方案
  8. 国服服务器_外服玩家热议LOL国服倒计时插件:说好的公平竞技呢?
  9. java ee文件下载_JavaEE实现文件下载
  10. laydate点击输入框闪一下不见了_爱剪辑:如何制作抖音、苹果风格的快闪视频...
  11. 吃鸡11月15服务器维护,绝地求生11月20日维护到几点 11.20吃鸡更新维护公告
  12. RabbitMQ三种Exchange
  13. 龙芯pmon 中Nand配置说明
  14. CMMI2.0和1.3之间的区别有哪些?
  15. think php5 离线手册,thinkphp5.0离线手册下载
  16. mysql int_mysql中int(10)代表什么意思?
  17. Python简单词云的制作
  18. C# WAV音乐多音轨合并
  19. js 生成UUID的几种方法
  20. 微信小程序原生开发学习01

热门文章

  1. 一键就能发布项目-DevOps_v1.0.1
  2. HTB----Heist(Hard)
  3. linux系统 安装nvm
  4. IntelliJ IDEA如何修改版权信息
  5. 一分钟搞定最长公共子序列与最长公共子串的问题
  6. springboot学生选课系统毕业设计源码291510
  7. Nacos Committer 张龙:Nacos Sync 的设计原理和规划
  8. Druid Monitor监控
  9. c语言 异或 浮点数存储 分支结构
  10. input值不可变、隐藏input(表单隐藏域)