基本上讲,Adam就是将day8.2提到的momentum动量梯度下降法和day8.3提到的RMSprop算法相结合的优化算法

首先初始化 SdW = 0 Sdb = 0 VdW = 0 Vdb = 0

On iteration t:

  compute dw,db using current Mini-batch

  VdW = β1vdW  +  (1-β1)dW  Vdb  = β1vdb +  (1-β1)db    先做momentum

  SdW = β2SdW  +  (1-β2)dW2  Sdb  = β2Sdb +  (1-β2)db2 再做RMSprop

偏差修正:Vdwcorrected = vdW / (1 - β1t),Vdbcorrected = vdb / (1 - β1t)

        Sdwcorrected = SdW / (1 - β2t),Sdbcorrected = Sdb / (1 - β2t)

W = W - α(Vdwcorrected / sqrt.Sdwcorrected+ε),b = b - α(Vdbcorrected / sqrt.Sdbcorrected+ε)

超参数的设定:

α:learning rate,需要一系列的尝试

β1:0.9 (为了计算dw) one moment一阶矩

β2:0.999 (为了计算dw2) second moment二阶矩

ε:10-8

注意除α需要设定外,Adam算法的β1、β2、ε三个参数都不必去设定,根据Andrew Ng的解释来看很少有业内人士改变Adam算法原文的这三个参数

Adam = adaptive moment estimation

转载于:https://www.cnblogs.com/NWNU-LHY/p/11195798.html

ubuntu之路——day8.4 Adam自适应矩估计算法相关推荐

  1. ubuntu之路——day8.1 深度学习优化算法之mini-batch梯度下降法

    所谓Mini-batch梯度下降法就是划分训练集和测试集为等分的数个子集,比如原来有500W个样本,将其划分为5000个baby batch,每个子集中有1000个样本,然后每次对一个mini-bat ...

  2. 时延估计 matlab,LMS自适应时延估计matlab程序

    目前在做个超声波方便的东西,就是计算固定的距离的两点之间超声波的传播时间,因为我以前也没学过自适应滤波的知识,matlab也不怎么懂,所以现在就碰到一些困难. 附件是我用来仿真的一个MATLAB程序, ...

  3. 几种优化算法的读书笔记——梯度下降、牛顿法、拟牛顿法、随机梯度下降、AdaGrad、RMSProp、Adam及选择优化算法的建议

    文章目录 1 梯度下降 1.1 特点 1.2 思想 1.3 数学基础 1.4 具体算法 2 牛顿法和拟牛顿法 2.1 特点 2.2 牛顿法 2.2.1 数学基础 2.2.2 思想 2.2.3 具体算法 ...

  4. 老树新芽——矩估计遇到神经网络

    目录 老树新芽--矩估计遇到神经网络 问题 解决方案 \(\text{GARCH}(1,1)\) 模型的神经矩估计设想 代码实现 验证估计结果 \(\omega\) \(\alpha\) \(\bet ...

  5. 草莓采摘机器人——ROS导航(三)ROS自适应蒙特卡罗定位算法(ACML)理解

    草莓采摘机器人--ROS导航(三) ROS自适应蒙特卡罗定位算法(AMCL)理解 在详细解释ROS工作原理与步骤之前, 我想先Mark一下自适应蒙特卡罗定位算法的原理与思想. 毕竟算法才是王道. AM ...

  6. SGD,Adam,momentum等优化算法比较

    文章目录 SGD,Adam,momentum等优化算法总结 一.最基本的优化算法 1.SGD 2.Momentum 二.自适应参数的优化算法 1.Adagrad 2.RMSprop 3.Adam 三. ...

  7. 基于特征点匹配的自适应目标跟踪算法

    基于特征点匹配的自适应目标跟踪算法 2016-01-29 13:11 摘 要:由于实际场景复杂多变,目标在运动过程中往往会出现形变.遮挡等问题,增加了跟踪的难度.为了解决上述问题,提出一种基于特征点匹 ...

  8. Algorithm:【Algorithm算法进阶之路】之十大经典排序算法

    Algorithm:[Algorithm算法进阶之路]之十大经典排序算法 相关文章 Algorithm:[Algorithm算法进阶之路]之数据结构二十多种算法演示 Algorithm:[Algori ...

  9. C++Adaline自适应线性神经网络算法(附完整源码)

    C++Adaline自适应线性神经网络算法 C++Adaline自适应线性神经网络算法完整源码(定义,实现,main函数测试) C++Adaline自适应线性神经网络算法完整源码(定义,实现,main ...

最新文章

  1. 【全新打造】思科认证跟踪系统考试注册教程(08.8.30)附word文件下载
  2. 海龟绘图画花朵_我家宝宝最喜欢的一本图画书——我的连衣裙
  3. Java单层循环实现输出九九乘法表
  4. 【BZOJ】【1038】【ZJOI2008】瞭望塔
  5. 小米MIX 4真机亮屏照曝光?真全面屏 边框窄到窒息
  6. 双级减速器优化matlab,基于matlab的二级齿轮减速器的优化设计.doc
  7. 2.2创建Spring数据REST服务
  8. LDD3 第15章 内存映射和DMA
  9. 电脑常用音频剪辑软件_常用手机视频剪辑软件
  10. 电力安全工作规程发电厂和变电站电气部分_电气主接线知识精讲!
  11. 计量经济学学习笔记:多元线性模型
  12. 让电脑假装蓝屏的C语言,【技术天地】一句命令让你的电脑蓝屏~(有强迫症的童鞋试试~~)...
  13. 易语言群控雷电_安卓群控系统雷电模拟器安卓多开模拟器多开群控系统企业自动化的营销系统软件-资源下载随便下源码网...
  14. 研究生毕业做软件测试,毕业研究生,转学软件测试月薪11K,会做选择的人生到底有多赚?...
  15. org.apache.ibatis.binding.BindingException: Type interface com.chen.dao.PersonDao is not known to th
  16. 中望3D 2022 基准平面
  17. 如何使用 JavaScript 显示/隐藏或切换 DIV 元素
  18. 显示器html看电视声音,使用显示器的内置音响播放声音需要满足以下两种条件...
  19. android l风格cm10主题,Android 4.3的CM10.2
  20. ATTCK红日靶场二

热门文章

  1. c#一个分页控件的例子
  2. .net堆栈与托管堆的区别
  3. 微软SQL Server数据库的两种请求游标
  4. C#里调用带输出参数的存储过程
  5. Java8新特性:接口的默认方法与接口的静态方法
  6. Java 基本功之(一)入门知识点
  7. 哈佛研究人员开发基于折纸造型高精度微型手术机器人
  8. 上海15岁女高中生蝉联“最年轻科学家”
  9. 平板电脑怎么投屏到电视上_电脑屏幕投屏到平板、IPAD、艾派德
  10. Jquery validate验证表单只验证第一个input元素