神经网络(11)--具体实现:unrolling parameters
我们需要将parameters从矩阵unrolling到向量,这样我们就可以使用adanced optimization routines.
unroll into vectors
costFunction与fminunc里面的theta都是n+1维的向量,costFunction的返回值gradient也是n+1维的向量。
但是当我们使用神经网络时,我们的Θ和gradient都是一个矩阵,而不是一个向量.在这儿我们的目标是将这些矩阵展开为向量,这样就可以使用上面的这两个函数了。
如何unroll成向量的例子
如上图所示,我们可以将矩阵转换为向量(thetaVec and DVec are big long vector),也可以将向量利用reshape变为矩阵。
具体的unrolling如何工作的
在costFunction中,我们会从thetaVec中得到Θ(1),Θ(2),Θ(3),,这样方便我们计算后面所需要的D(1),D(2),D(3),和J(Θ);
然后再将这些D(1),D(2),D(3)unroll to 得到gradientVec进行返回。
总结(什么时候使用矩阵,什么时候使用向量)
使用矩阵的情况: 当做forward propagation 和 back propagation时,我们需要使用矩阵来计算,这里就需要用reshape来构建矩阵。
使用向量的情况: 当使用fminunc这些advanced算法的时候,这些函数的参数是向量,这时我们需要将矩阵转化为向量来计算。
转载于:https://www.cnblogs.com/yan2015/p/5023847.html
神经网络(11)--具体实现:unrolling parameters相关推荐
- 神经网络学习小记录72——Parameters参数量、FLOPs浮点运算次数、FPS每秒传输帧数等计算量衡量指标解析
神经网络学习小记录72--Parameters参数量.FLOPs浮点运算次数.FPS每秒传输帧数等计算量衡量指标解析 学习前言 网络的运算时组成 我们要关注网络的什么指标 1.Parameters参数 ...
- 深度学习-Tensorflow2.2-RNN循环神经网络{11}-RNN空气污染预测-26
import tensorflow as tf import matplotlib.pyplot as plt %matplotlib inline import numpy as np import ...
- 深度学习-Tensorflow2.2-RNN循环神经网络{11}-评论分类-25
什么是RNN? 代码 import tensorflow as tf import matplotlib.pyplot as plt %matplotlib inline import numpy a ...
- 这就是神经网络 11:深度学习-语义分割-DFN、BiSeNet、ExFuse
前言 本篇介绍三篇旷视在2018年的CVPR及ECCV上的文章.旷视做宣传做的很好,出的论文解读文章很赞,省去了我从头开始理解的痛苦,结合论文基本能很快了解全貌. 语义分割任务同时需要 Spatial ...
- Machine Learning - Andrew Ng on Coursera (Week 5)
本篇文章将分享Coursera上Andrew Ng的Machine Learning第五周的课程,主要内容有如下,详细内容可以参考文末附件: 代价函数及后向算法 Cost function(代价函数) ...
- week5_神经网络
文章目录 神经网络:学习(Netural NetWorks:Learning) 1.代价函数(Cost Function) 2.反向传播算法(Backpropagation Algorithm) 3. ...
- Coursera吴恩达《神经网络与深度学习》课程笔记(5)-- 深层神经网络
红色石头的个人网站:redstonewill.com 上节课我们主要介绍了浅层神经网络.首先介绍神经网络的基本结构,包括输入层,隐藏层和输出层.然后以简单的2 layer NN为例,详细推导了其正向传 ...
- Stanford机器学习---第五讲. 神经网络的学习 Neural Networks learning
原文见http://blog.csdn.net/abcjennifer/article/details/7758797,加入了一些自己的理解 本栏目(Machine learning)包含单參数的线性 ...
- BP神经网络算法:将参数矩阵向量化
上一篇<机器学习:神经网络的代价函数及反向传播算法>记录了如何使用反向传播算法计算代价函数的导数,其中一个细节就是需要把参数的矩阵表达式展开成向量的形式,以便在后来使用高级的优化算法.Ng ...
最新文章
- TFmini传感器使用
- Android 利用方向传感器实现 指南针
- 【计算机网络】网络安全 : 公钥密码体质 ( 公钥 - 加密密钥 | 私钥 - 解密密钥 | 与对称密钥体质对比 | 特点 | 数字签名引入 )
- 《动手玩转Arduino》——2.4 展望
- ASP.NET Core开发常见“坑”
- [翻译]XNA外文博客文章精选之sixteen(中)
- 鸿蒙系统什么时候超过苹果,为何任正非说鸿蒙系统想超过苹果系统需要的时间,不会超过300年...
- 每日一程-4. PyQt5-实现显示和业务逻辑分离
- vmplayer linux kernel headers
- 微信公共平台开发(一):服务器配置
- otn与stn网络_otn与stn网络_光通信网络
- 微软云存储SkyDrive API:将你的数据连接到任何应用、任何平台,及任何设备上
- qt离线下载地址5.14.2
- Pyton爬虫实现豆瓣登陆
- 【Error2013:2013 lost connection to MYSQL server在处理大量数据运行中报错解决方法】
- 计蒜客 人人都有极客精神(模拟)
- AI-常见机器学习算法介绍
- hypermesh错误1000
- 计算机毕业设计(51)java小程序毕设作品之教室图书馆座位预约小程序系统
- 福建计算机等级考试停考,惊闻|福建省要停考计算机等级考试?!
热门文章
- python chrome headless_[技巧] chrome headless 爬虫抓取websoket 数据
- html转换pdf软件,html转换成高质量的PDF文件[跨平台开源软件]
- oracle数据库的医院信息系统数据库升级方案,医院信息系统数据库从Oracle8i到10gR2升级的实现...
- 一文带你学会 UML--用例图
- 深度使用魅族16T后的评价(本人魅友,绝对客观公正,不要盲目的为手机厂商辩护,想想从当初到现在,魅族正在一步步背离自己的信仰,有问题,解决问题才能有更好的发展)
- HTML--HTML入门篇(我想10分钟入门HTML,可以,交给我吧)
- HDU - 1253 胜利大逃亡(搜索)
- 【三分钟讲清区块链/比特币】之一:区块链入门教程
- yii的多个相同modle表单提交问题(未解决)
- mysql update中使用subquery