神经网络的 Delta 学习规则(learning rule)
1. δ\delta 学习规则
1986 年,由认知心理学家 McClelland 和 Rumellhart 在神经网络训练中引入了 Δ\Delta 学习规则,该规则亦可称为连续感知器学习规则(与离散感知器学习规则相并行)。Δ\Delta 规则的学习信号规定为:
r=\left(d_j-f(w_j^Tx)\right)f'(w_j^Tx)=\left(d_j-o_j)\right)f'(\text{net}_j)
jj 表示不同的迭代过程。上式定义的学习信号称为 δ\delta。显然 δ\delta 规则要求转移函数可导。
2. 由 δ\delta 规则到最小平方误差
定义神经元输出与期望输出之间的平方误差为:
E=\frac12\left(d_j-o_j\right)^2=\frac12\left(d_j-f(w_j^Tx)\right)^2
欲使误差 EE 最小,梯度的变化方向应是负梯度方向:
\Delta w_j=-\eta \nabla E
其中:
\nabla E=-\left(d_j-f(w_j^Tx)\right)f'(w_j^Tx)x
因此:
\Delta w_j=\eta\left(d_j-f(w_j^Tx)\right)f'(w_j^Tx)x=\eta\left(d_j-f(w_j^Tx)\right)f'(\text{net}_j)x
神经网络的 Delta 学习规则(learning rule)相关推荐
- 神经网络(线性神经网络、Delta学习规则)
线性神经网络 线性神经网络在结构上与感知器非常相似,只是激活函数不同.在模型训练时把原来的sign函数改成了purelin函数:y = x 除了sign和purelin,还有很多常用的激活函数: De ...
- delta学习规则及梯度下降法
Delta学习规则 代价函数(Cost Function, Lost Function) 其中,误差E是权向量Wj的函数.欲使误差E最小,Wj与误差的负梯度成正比,即: 梯度下降法的问题 1. 学习率 ...
- 神经网络 | 网络优化-线性神经网络-delta学习规则-梯度下降法(线性神经网络-异或问题Python源代码)
===================================================== github:https://github.com/MichaelBeechan CSDN: ...
- 神经网络 | 网络优化-线性神经网络-delta学习规则-梯度下降法(单层感知器-异或问题Python源代码)
===================================================== github:https://github.com/MichaelBeechan CSDN: ...
- 技术图文:如何利用 C# 实现 误差反向传播 学习规则?
背景 我们在 如何利用 C# 对神经网络模型进行抽象? 中完成了神经网络的抽象结构: 三个接口:激活函数.有监督学习.无监督学习 三个抽象类:神经元.网络层.网络拓扑 我们在 如何利用 C# 实现神经 ...
- Neural Networks and Deep Learning - 神经网络与深度学习 - Overfitting and regularization - 过拟合和正则化
Neural Networks and Deep Learning - 神经网络与深度学习 - Overfitting and regularization - 过拟合和正则化 Neural Netw ...
- Hebb学习规则与Hopfield神经网络
前言 本文简单介绍了一下Hebb学习规则和Hopfield神经网络,并讨论了二者的特性和意义,以及它们之间的联系.最后代码实现了一个简单Hopfield网络,能够记忆并联想回忆出一张图片. Hebb学 ...
- 吴恩达深度学习笔记——神经网络与深度学习(Neural Networks and Deep Learning)
文章目录 前言 传送门 神经网络与深度学习(Neural Networks and Deep Learning) 绪论 梯度下降法与二分逻辑回归(Gradient Descend and Logist ...
- [翻译] 神经网络与深度学习 第六章 深度学习 - Chapter 6 Deep learning
目录: 首页 译序 关于本书 关于习题和难题 第一章 利用神经网络识别手写数字 第二章 反向传播算法是如何工作的 第三章 提升神经网络学习的效果 第四章 可视化地证明神经网络可以计算任何函数 第五章 ...
最新文章
- 如何正确连接数据库???
- 通过/proc/sys/net/ipv4/优化Linux下网络性能
- 介绍几个好用的android自定义控件
- 统计机器学习第二章 感知机
- 数据的预处理与特征构建(申请评分卡模型)
- 该不该放弃单片机,嵌入式这条路?
- Confluent官博:Kafka最牛队列,性能15倍于RabbitMQ!
- “睡服”面试官系列第十五篇之对象的扩展(建议收藏学习)
- Qt笔记-Linux程序打印带颜色的字符串
- 关于WP7中的90M内存限制问题及设计原则
- 通信风口下,App 即将消亡?
- C++构造函数、析构函数与抛出异常
- 导入php插件_微信公众号吸粉的方法(将网站100%的流量导入到公众号中)
- 极限中0除以常数_谈用泰勒展开法求极限
- 各编程语言用途及分类
- 一款经典的 jQuery Lightbox 灯箱效果
- [Python]网络爬虫(一):抓取网页的含义和URL基本构成
- 读李智慧的《大型网站技术架构—核心原理与案例分析》有感
- 勤做眼保健操,减轻眼睛疲劳
- 【arXiv 2021】Cluster Contrast for Unsupervised Person Re-Identification(CCU)
热门文章
- VC++ Tab Control控件的使用
- apache 下载安装linux,linux下安装apache详解
- python变量作用域图解_图解python全局变量与局部变量相关知识
- VUE3.0引入本地js文件
- hive中的lateral view的解析
- db2 查看属性的数据类型 小数位 null约束
- Object类的使用,包装类的使用
- 计算机拆装与维修技能综述,综述虚拟机在计算机硬件组装与维护教学中的应用...
- socket()编程简介
- win10 + bazel-0.20.0 + tensorflow-1.13.1 编译tensorflow GPU版本的C++库