cnn 反向传播推导_深度学习中的参数梯度推导(三)下篇
前言
在深度学习中的参数梯度推导(三)中篇里,我们总结了CNN的BP推导第一步:BP通过池化层时梯度的计算公式。本篇(下篇)则继续推导CNN相关的其他梯度计算公式。
注意:本文默认读者已具备深度学习上的基本知识
3.2
CNN的BP推导
接下来我们要看看误差逆着经过卷积层会发生什么事情。
那么在反向传播时,我们所讨论的是:
下面正式开始。
数学上和CNN上的卷积操作的区别是,卷积核在前者需要翻转180度。
我们先以一个简单的例子说明为啥这里卷积核要翻转,为啥相对于前传的valid convolution,反传要做full convolution。
接着我们模拟反向求导:
这上面9个式子其实可以用一个矩阵卷积的形式表示,即:
一个结论是如果前向传播是valid模式的卷积运算,那么反向传播就需要做full模式的卷积操作。
接着让我们再看一个不寻常的例子2:
对上述式子展开,进行元素级分析:
其中卷积符号代表CNN中的卷积操作,利用该定义,我们得到:
接着我们模拟反向求导过程:
实际我们可以用下面这个卷积运算来表示上面这些海量的偏导数:
如果我们想让stride>1时和stride=1时的结果能得到统一,我认为那么我们可以将stride>1的情况视为是stride=1的特殊情况,例如,stride=2的话,两个矩阵先按照stride=1那样进行卷积,只是位移如果不够2的话(换句话说,位移总次数如果不能被2整除),卷积结果就输出0。这样我们就得到下面这个计算模式:
现在我们总结下CNN的反向传播算法,以最基本的批量梯度下降法为例来描述反向传播算法。
参考资料
https://www.cnblogs.com/pinard/p/6519110.html
https://grzegorzgwardys.wordpress.com/2016/04/22/8/#unique-identifier
深度学习
TO BE CONTINUED
数学
文章作者: 中国电信研究院 | 刘心唯
文章内容系作者个人观点,不代表融智未来公众号的观点或立场。
往期 · 推荐
● 深度学习中的参数梯度推导(一)上篇
● 深度学习中的参数梯度推导(一)下篇
● 深度学习中的参数梯度推导(二):深度神经网络(DNN)的前传与反传
● 深度学习中的参数梯度推导(三)上篇
● 深度学习中的参数梯度推导(三)中篇
你们点点“分享”,给我充点儿电吧~
cnn 反向传播推导_深度学习中的参数梯度推导(三)下篇相关推荐
- eta 深度学习 参数_深度学习中的参数梯度推导(一)
必备的数学知识 矩阵微分与求导 前言 深度学习向来被很多人认为是"黑盒",因为似乎很多人都不清楚深度学习的运作方式,本系列<深度学习中的数学>的连载文章主要目的就是向大 ...
- gan 总结 数据增强_深度学习中的数据增强(下)
言有三 毕业于中国科学院,计算机视觉方向从业者,有三工作室等创始人 编辑 | 言有三 今天带来深度学习中的数据增强方法的下篇.我们将从以下几个方向入手.1,介绍一下什么是无监督的数据增强方法.2,简单 ...
- nfa确定化 dfa最小化_深度学习中的优化:梯度下降,确定全局最优值或与之接近的局部最优值...
深度学习中的优化是一项极度复杂的任务,本文是一份基础指南,旨在从数学的角度深入解读优化器. 一般而言,神经网络的整体性能取决于几个因素.通常最受关注的是网络架构,但这只是众多重要元素之一.还有一个常常 ...
- sigmoid函数_深度学习中激活函数总结
一.前言 前段时间通过引入新的激活函数Dice,带来了指标的提升,借着这个机会,今天总结下常用的一些激活函数. 激活函数在深度学习中起着非常重要的作用,本文主要介绍下常用的激活函数及其优缺点.主要分为 ...
- 差分隐私 深度学习_深度学习中的差异隐私
差分隐私 深度学习 I would like to thank Mr. Akshay Kulkarni for guiding me on my journey in publishing my fi ...
- 深度学习中的注意力机制(三)
作者 | 蘑菇先生 来源 | NewBeeNLP原创出品 深度学习Attenion小综述系列: 深度学习中的注意力机制(一) 深度学习中的注意力机制(二) 目前深度学习中热点之一就是注意力机制(Att ...
- 【NLP】四万字全面详解 | 深度学习中的注意力机制(三)
NewBeeNLP原创出品 公众号专栏作者@蘑菇先生 知乎 | 蘑菇先生学习记 深度学习Attenion小综述系列: 四万字全面详解 | 深度学习中的注意力机制(一) 四万字全面详解 | 深度学习中的 ...
- nfa确定化 dfa最小化_深度学习中的不确定性
原文:What Uncertainties Do We Need in Bayesian Deep Learning for Computer Vision? (NIPS 2017) 深度学习模型给出 ...
- CNN做时间序列预测_深度学习与时间序列预测
论文下载地址: N-BEATS: Neural basis expansion analysis for interpretable time series forecastingarxiv.org ...
最新文章
- 机器学习实战 k-近邻算法 使用matplotlib创建散点图
- 红外遥感设计报告论文+电路原理图
- 智慧城市锁定创新,智能AI助力智慧健康
- ldconfig及LD_LIBRARY_PATH
- mongodb 事务_MongoDB 事务 — 基础入门篇
- InfoVista.NET 内部数据格式简介
- 角色操作-查询所有角色流程分析
- 包含以下字段的 struct 怎么解决_S7-300/400进阶笔记4-2:STEP7的“结构”STRUCT数据类型的用法...
- 头像星球html,HTML5 Canvas 星球大战黑武士头像
- 希望我在开始第一个机器学习项目之前就了解的那些事儿
- 设置pandas显示行数_Pandas这样来设置,做数据分析舒适百倍
- 文末送书 | 高级机器学习范式——终身机器学习
- Spring Boot(2)---Spring Boot文档及其导航说明
- 使用当前更改创建Git分支
- 【Python 12】汇率兑换5.0(Lambda函数)
- ios 模糊搜索支持首字母搜索、拼音搜索、汉字搜索
- SAP 金税解决方案
- Mac新手使用技巧——Mac如何强制关机
- JSP界面——背景图片
- 地址总线是单向还是双向_双向可控硅和单向可控硅的区别
热门文章
- ASP.NET MVC实践系列5-结合jQuery
- [转]详解编译预处理
- U-Mail邮件网关测试勒索病毒样例图
- Mybatis传多个参数(推荐)
- centos6.5安装remmina rdp
- 炉石传说 C# 设计文档(序)
- 丢掉uVision2吧,uVision早就有了
- Nginx使用http auth basic认证保护后台admin
- ipfs浏览器java实现_IPFS + Ethereum(上篇):JS+IPFS-API存储和获取数据
- centos装oracle6,CentOS-6.7下安装Oracle11g