Exponentially Weighted Averages

vt=βvt−1+(1−β)θtvt=βvt−1+(1−β)θtv _{t} = \beta v _{t - 1} + \left (1 - \beta \right ) \theta _{t}
=β[βvt−2+(1−β)θt−1]+(1−β)θt=β[βvt−2+(1−β)θt−1]+(1−β)θt= \beta \left [ \beta v _{t - 2} + \left (1 - \beta \right ) \theta _{t - 1} \right ] + \left (1 - \beta \right ) \theta _{t}
=β2vt−2+β(1−β)θt−1+(1−β)θt=β2vt−2+β(1−β)θt−1+(1−β)θt= \beta ^2 v _{t - 2} + \beta \left (1 - \beta \right ) \theta _{t - 1} + \left (1 - \beta \right ) \theta _{t}
=βnvt−n+(1−β)∑i=0n−1βiθt−i=βnvt−n+(1−β)∑i=0n−1βiθt−i= \beta ^{n} v _{t - n} + \left (1 - \beta \right ) \sum \limits_{i = 0} ^{n - 1} \beta ^{i} \theta _{t - i}
令 n=⌊11−β⌋,n=⌊11−β⌋,n = \left \lfloor \dfrac {1} {1 - \beta} \right \rfloor, 则
limβ→1βn=limβ→1β⌊11−β⌋=limβ→1β11−β=1elimβ→1βn=limβ→1β⌊11−β⌋=limβ→1β11−β=1e\lim \limits_{ \beta \to 1} \beta ^{n} = \lim \limits_{ \beta \to 1} \beta ^{\left \lfloor \dfrac {1} {1 - \beta} \right \rfloor} = \lim \limits_{ \beta \to 1} \beta ^{ \dfrac {1} {1 - \beta} } = \dfrac {1} {e}
因此 vt≈1evt−n+1n∑i=0n−1βiθt−ivt≈1evt−n+1n∑i=0n−1βiθt−iv _{t} \approx \dfrac {1} {e} v _{t - n} + \dfrac {1} {n} \sum \limits_{i = 0} ^{n - 1} \beta ^{i} \theta _{t - i}
≈1n∑i=0n−1θt−i≈1n∑i=0n−1θt−i\approx \dfrac {1} {n} \sum \limits_{i = 0} ^{n - 1} \theta _{t - i}

Bias Correction

vt=⎧⎩⎨0,11−βt[βvt−1+(1−β)θt],t=0otherwisevt={0,t=011−βt[βvt−1+(1−β)θt],otherwisev _{t} = \begin{cases} 0, & t = 0 \\ \dfrac {1} {1 - \beta ^ t} \left [ \beta v _{t - 1} + \left (1 - \beta \right ) \theta _{t} \right ], & \text{otherwise} \end{cases}

性质

v1=θ1v1=θ1v _{1} = \theta _{1}
limt→+∞(1−βt)=1limt→+∞(1−βt)=1\lim \limits_{ t \to + \infty} \left (1 - \beta ^ t \right ) = 1

Exponentially Weighted Averages相关推荐

  1. EWMA(Exponentially Weighted Moving Average)指数加权移动平均

    原博:http://blog.csdn.net/sony_zhang/article/details/7256646 EWMA(Exponentially Weighted Moving Averag ...

  2. 吴恩达老师深度学习视频课笔记:优化算法

    优化算法能够帮助你快速训练模型.         mini-batch梯度下降法:把训练集分割(split)为小一点的子训练集,这些子集被叫做mini-batch. batch梯度下降法指的是:同时处 ...

  3. 计算机视觉技术 图像分类_如何训练图像分类器并教您的计算机日语

    计算机视觉技术 图像分类 介绍 (Introduction) Hi. Hello. こんにちは 你好 你好. こんにちは Those squiggly characters you just saw ...

  4. deep learning 作業 2.2

    为什么80%的码农都做不了架构师?>>>    Optimization Methods Until now, you've always used Gradient Descent ...

  5. 【Paper】An Experiment Comparing Double Exponential Smoothing and Kalman Filter-Based Predict

    算法 Paper DES (Double Exponential Smoothing) 算法 Kalman-Filter Algorithm KF EKF Exponentially Weighted ...

  6. 2.4 理解指数加权平均-深度学习第二课《改善深层神经网络》-Stanford吴恩达教授

    ←上一篇 ↓↑ 下一篇→ 2.3 指数加权平均 回到目录 2.5 指数加权平均的偏差修正 理解指数加权平均 (Understanding Exponentially Weighted Averages ...

  7. 2.3 指数加权平均-深度学习第二课《改善深层神经网络》-Stanford吴恩达教授

    ←上一篇 ↓↑ 下一篇→ 2.2 理解 mini-batch 梯度下降法 回到目录 2.4 理解指数加权平均 指数加权平均 (Exponentially Weighted Averages) 我想向你 ...

  8. 吴恩达深度学习课程deeplearning.ai课程作业:Class 2 Week 2 Optimization methods

    吴恩达deeplearning.ai课程作业,自己写的答案. 补充说明: 1. 评论中总有人问为什么直接复制这些notebook运行不了?请不要直接复制粘贴,不可能运行通过的,这个只是notebook ...

  9. 吴恩达《优化深度神经网络》精炼笔记(3)-- 超参数调试、Batch正则化和编程框架...

    AI有道 不可错过的AI技术公众号 关注 重要通知 本公众号原名"红色石头的机器学习之路"已经改名为"AI有道",请大家留意并继续关注本公众号!谢谢! 上节课我 ...

  10. 吴恩达深度学习笔记6-Course2-Week2【优化算法】

    优化算法 一.Mini-batch gradient descent(小批量梯度下降法) Mini-batch: 把整个训练数据集分成若干个小的训练集,即为Mini-batch. 为什么要分?梯度下降 ...

最新文章

  1. 唐山一个葬礼上的豪华车队
  2. C#可选参数、命名参数、参数数组
  3. Oracle 11 密码永不过期
  4. VLAD教程和资料 All about VLAD
  5. [洛谷P1822]魔法指纹
  6. N85通过wifi共享笔记本电脑网络的方法
  7. 蓝牙mesh网络基础
  8. 渗透之cookie截取
  9. 如何选择物联网通讯技术?
  10. 单元测试用例_前端单元测试实践
  11. 转:什么是Node.js?
  12. matlab 对称矩阵特征值为负数,MATLAB中对称矩阵的复特征向量
  13. ROS——创建工作空间并编译示例
  14. 学编程必备:3 大编程字体!让你在编程的时候原地起飞!
  15. VO、DTO、BO、PO、DO、POJO 数据模型的理解和实际使用
  16. 【深度学习】120G+训练好的word2vec模型(中文词向量)
  17. REST-Assured,接口自动化的 “瑞士军刀“- 断言篇
  18. python爬上市公司信息_实战项目 1:5 行代码爬取国内所有上市公司信息
  19. 西门子S7-1200PLC堆栈程序 在使用西门子1200PLC时候发现,系统没有自带的堆栈功能块,不能实现数据的先进先出后进后出功能
  20. 硅谷“钢铁侠”:最不爱钱的人,却成了最有钱的人!

热门文章

  1. 银行的起源---》阮一峰,
  2. 《Java程序设计语言(第4版)》阅读笔记(1)
  3. java异步文件读写文件,Java AsynchronousFileChannel和Future读取文件
  4. doctrine2 mysql_Doctrine2-完整创建数据库
  5. redis详解_java 从零开始手写 redis(14)redis渐进式rehash详解
  6. java 什么是封闭类,封闭类与声明类
  7. NYOJ 156 Hangover
  8. 计算机组成cpu性能公式,2020考研计算机组成原理知识点:计算机性能指标
  9. 机器学习建模商务合作
  10. linux vnc服务器6,Linux(RHEL6\CENTOS6\OLE6) 下VNC-SERVER安装与配置