为了使模型在测试数据上更健壮的方法——————滑动平均模型。在采用随机梯度下降算法训练神经网络时,使用滑动平均模型在很多应用中都可以在一定程度上提高最终模型在测试训练数据上的表现。

在Tensorflow中提供tf.train.ExponentialMovingVaerage来实现滑动平均模型。在初始化ExponentialMovingAverage时,需要提供一个衰减率,用于控制模型的更新速度。ExponentialMovingAverage对每一个变量会维护一个影子变量(shadow_variable),这个影子变量的初始值就是相应变量的初始值,每次运行变量更新时,影子变量的值会更新为:

shadow_variable=decay x shadow_variable+(1-decay)xvariable

从上式可以看出,decay决定了模型更新速度,越大模型越趋于稳定实际应用中一般设置为非常接近1的数。ExponentialMovingAverage还提供了num_updates参数来动态设置decay的大小,其更新原理如下

下面代码演示如何使用滑动平均:

import tensorflow as tf
#定义一个变量用于计算滑动平均,这个变量的初始值为0,这里手动指定了
#比那两类型为tf.float32,因为所有需要计算滑动平均的变量必须是实数型
v1=tf.Variable(0,dtype=tf.float32)
#这里step变量模拟神经网络中迭代的轮数,可以用于动态控制衰减率。
step=tf.Variable(0,trainable=False)
#定义一个滑动平均的类(class)。初始化时给定了衰减率(0.99)和控制衰减率的变量step。
ema=tf.train.ExponentialMovingAverage(0.99,step)
#定义一个更新变量滑动平均的操作这里需要给定一个列表,每次执行这个操作时
#这个列表中的变量都会被更新
maintain_averages_op=ema.apply([v1])
with tf.Session() as sess:#初始化所有变量init_op=tf.global_variables_initializer()sess.run(init_op)#通过ema.average(v1)获取滑动平均之后变量的取值。在初始化时候,变量v1的值和v1的滑动平均都是0print(sess.run([v1,ema.average(v1)]))sess.run(tf.assign(v1,5))sess.run(maintain_averages_op)print(sess.run([v1,ema.average(v1)]))sess.run(tf.assign(step,10000))sess.run(tf.assign(v1,10))sess.run(maintain_averages_op)print(sess.run([v1,ema.average(v1)]))sess.run(maintain_averages_op)print(sess.run([v1,ema.average(v1)]))

Tensorflow笔记之滑动平均模型相关推荐

  1. TensorFlow入门:滑动平均模型

    在TensorFlow中提供了tf.train.ExponentialMovingAverage 来实现滑动平均模型,在采用随机梯度下降算法训练神经网络时,使用其可以提高模型在测试数据上的健壮性(ro ...

  2. tensorflow随笔-滑动平均模型

    随机梯度下降算法训练时,使用滑动平均模型 可以提高模型健壮性. 在Tensorflow中提供了tf.train.ExponentialMovingAverage来实现滑动平均模型.在初始化Expone ...

  3. 【TensorFlow】TensorFlow从浅入深系列之五 -- 教你详解滑动平均模型

    本文是<TensorFlow从浅入深>系列之第5篇 TensorFlow从浅入深系列之一 -- 教你如何设置学习率(指数衰减法) TensorFlow从浅入深系列之二 -- 教你通过思维导 ...

  4. tensorflow随机梯度下降算法使用滑动平均模型

    在采用随机梯度下降算法训练神经网络时,使用滑动平均模型可以提高最终模型在测试集数据上的表现.在Tensflow中提供了tf.train.ExponentialMovingAverage来实现滑动平均模 ...

  5. 浅谈tensorflow的指数衰减学习率、正则化、滑动平均模型

    指数衰减学习率使训练迭代更加有效: 学习率决定了每一次迭代训练过程优化神经网络数的幅度,学习率的正确选取对于训练的效率.和效果均有一定的影响,如果我们学习率设定过大,则会可能导致参数在极值两侧跳动,这 ...

  6. TensorFlow滑动平均模型

    指数加权平均算法的原理 TensorFlow中的滑动平均模型使用的是滑动平均(Moving Average)算法,又称为指数加权移动平均算法(exponenentially weighted aver ...

  7. Tensorflow:滑动平均模型

    本文转载自:TensorFlow入门:滑动平均模型 在TensorFlow中提供了tf.train.ExponentialMovingAverage 来实现滑动平均模型,在采用随机梯度下降算法训练神经 ...

  8. Tensorflow详解(八)——滑动平均模型

    目录 1.目标: 2.python实现方法: 3.tensorflow计算步骤: 1.目标: 为了在采用随机梯度下降算法训练神经网络时提高最终模型在测试数据上的表现,Tensorflow提供了一种在变 ...

  9. tensorflow 3.滑动平均模型

    # import tensorflow as tf #定义一个变量用于计算滑动平均,这个变量的初始值为0,注意这里手动指定了变量的类型为tf.float32, # 因为所有需要计算滑动平均的变量必须是 ...

最新文章

  1. Spring AOP 源码分析 - 筛选合适的通知器
  2. 【中级软考】计算能力足够强大,所有加密算法原理上都会被破解吗?
  3. 实验楼 “python3简明教程” 挑战三:玩转函数
  4. powerbuilder查询符合条件的数据并且过滤掉其他数据_论文浅尝 ISWC2020 | KnowlyBERT: 知识图谱结合语言模型补全图谱查询...
  5. 分布式系统的构建原则
  6. k短路-洛谷P2483 [SDOI2010]魔法猪学院
  7. Linux初学者需了解的知识
  8. 凯恩帝1000对刀图解_KND数控车床对刀方法
  9. win10重置计算机网络设置,win10网络重置后,win10网络重置怎么恢复
  10. python心得总结知识点和收获,千锋Python培训心得 在总结中收获提升
  11. SVG代码例子及含义
  12. 每天学一点设计模式-工厂方法模式
  13. UniApp 小程序实现PDF电子签名 拖拽
  14. Python 神器!自动识别文字中的省市区并绘图
  15. WebLogic之WebLogic安装
  16. html坦克游戏,HTML5制作的坦克游戏
  17. python如何从txt文件中解析出有效的数据
  18. 云服务器和一般服务器之间有什么区别?
  19. 【BYM】Android 仿百度搜索列表滑动效果,又到一年金三银四
  20. 关于开学第一周的总结

热门文章

  1. ev3双光感巡线原理_EV3 三光感巡线简易实现原理
  2. flv.js 插件 完成 flv 格式的视频播放
  3. mike42 escpos-php,mike42 / escpos-PHP的UTF-8没有打印西里尔(mike42/escpos-php
  4. TM01圆柱体稳态热传导对比分析
  5. php分类信息模板,phpcms 分类信息模型
  6. NBearLite使用入门
  7. 单页web开发,学习CSS行内样式
  8. 2008年世界一级方程式车队车手和赛程安排
  9. MACH SYSTEMS
  10. for循环对数组push一个对象时遇到的坑