在tensorflow中,有一个初始化函数:tf.contrib.layers.variance_scaling_initializer。Tensorflow 官网的介绍为:

variance_scaling_initializer(
factor=2.0,
mode='FAN_IN',
uniform=False,
seed=None,
dtype=tf.float32
)
1
2
3
4
5
6
7
Returns an initializer that generates tensors without scaling variance.

When initializing a deep network, it is in principle advantageous to keep the scale of the input variance constant, so it does not explode or diminish by reaching the final layer. This initializer use the following formula:

if mode='FAN_IN': # Count only number of input connections.
n = fan_in
elif mode='FAN_OUT': # Count only number of output connections.
n = fan_out
elif mode='FAN_AVG': # Average number of inputs and output connections.
n = (fan_in + fan_out)/2.0

truncated_normal(shape, 0.0, stddev=sqrt(factor / n))
1
2
3
4
5
6
7
8
这段话可以理解为,通过使用这种初始化方法,我们能够保证输入变量的变化尺度不变,从而避免变化尺度在最后一层网络中爆炸或者弥散。

这个方法就是 Xavier 初始化方法,可以从以下这两篇论文去了解这个方法:

·X. Glorot and Y. Bengio. Understanding the difficulty of training deepfeedforward neural networks. In International Conference on Artificial Intelligence and Statistics, pages 249–256, 2010.
Y. Jia, E. Shelhamer, J. Donahue, S. Karayev, J. Long, R. Girshick, S.Guadarrama, and T. Darrell. Caffe: Convolutional architecture for fast featureembedding. arXiv:1408.5093, 2014.
或者可以通过这些文章去了解:

CNN数值
三种权重的初始化方法
深度学习——Xavier初始化方法
---------------------
作者:路虽远在路上
来源:CSDN
原文:https://blog.csdn.net/u010185894/article/details/71104387
版权声明:本文为博主原创文章,转载请附上博文链接!

深度学习的Xavier初始化方法相关推荐

  1. 深度学习——Xavier初始化方法

    20210609 https://blog.csdn.net/u011534057/article/details/51673458 https://blog.csdn.net/luoxuexiong ...

  2. 深度学习 | 训练及优化方法

    ---------------------------- 原文发表于夏木青 | JoselynZhao Blog,欢迎访问博文原文. ---------------------------- 深度学习 ...

  3. 基于深度学习的动物识别方法研究与实现

    基于深度学习的动物识别方法研究与实现 目  录 摘  要 I ABSTRACT II     第一章  绪论 1 1.1 研究的目的和意义 1 1.2国内外研究现状 1 1.2.1 目标检测国内外研究 ...

  4. [深度学习论文学习笔记]多模态融合的深度学习脑肿瘤检测方法

    多模态融合的深度学习脑肿瘤检测方法 论文:http://www.photon.ac.cn/CN/article/downloadArticleFile.do?attachType=PDF&id ...

  5. 新闻上的文本分类:机器学习大乱斗 王岳王院长 王岳王院长 5 个月前 目标 从头开始实践中文短文本分类,记录一下实验流程与遇到的坑 运用多种机器学习(深度学习 + 传统机器学习)方法比较短文本分类处

    新闻上的文本分类:机器学习大乱斗 王岳王院长 5 个月前 目标 从头开始实践中文短文本分类,记录一下实验流程与遇到的坑 运用多种机器学习(深度学习 + 传统机器学习)方法比较短文本分类处理过程与结果差 ...

  6. 深度学习笔记:优化方法总结(BGD,SGD,Momentum,AdaGrad,RMSProp,Adam)

    深度学习笔记(一):logistic分类  深度学习笔记(二):简单神经网络,后向传播算法及实现  深度学习笔记(三):激活函数和损失函数  深度学习笔记:优化方法总结  深度学习笔记(四):循环神经 ...

  7. 基于深度学习的目标检测方法综述

    引言 现有的深度学习的目标检测方法,可以大致分为两类:一.基于候选区域的目标检测方法:二.基于回归的目标检测方法.依据方法的提出时间,可以构建出如下时间线: 2014 CVPR R-CNN[1] 20 ...

  8. 【CV】综述:基于深度学习的视觉跟踪方法进展

    人眼可以比较轻松地在一段时间内持续定位某个目标,而这对于计算机而言却是一项极具挑战的高级任务---目标跟踪.近年来,深度学习方法开始在目标跟踪领域崭露头角,并逐渐在性能上超越传统方法.温州大学人工智能 ...

  9. 【论文推荐】张笑钦团队 | 综述:基于深度学习的视觉跟踪方法进展

    导读 IJAC特约稿件 人眼可以比较轻松地在一段时间内持续定位特定目标,而在计算机视觉领域,这一任务便是高级计算机任务之一--"目标跟踪".但对计算机而言,在不同场景下实现目标跟踪 ...

最新文章

  1. mysql self join_mysql self join的实现--left join 和inner join
  2. Pair Poject 1 【新双人贪吃蛇】本组:龚逸 合作者:庞俊
  3. java 隐藏文件_java-如何仅列出jtree中的非隐藏文件和非系...
  4. O'Reilly 1500 份问卷调研:2019 年 Serverless 落地到底香不香?
  5. 【学习笔记】springboot中的全局异常处理 和@ControllerAdvice的使用
  6. shell脚本规划化模板
  7. EasyNVR、EasyDSS二次开发之:RTMP、HLS流在web页面进行无插件播放示例Demo代码
  8. 【Windows】将notepad++添加到右键菜单中
  9. Linux系统安装MySQL5.7,授权远程登陆
  10. centos改变文件拥有者_每天学点之CentOS软件二进制包安装
  11. 1026. 程序运行时间(15)-PAT乙级真题
  12. Xcode可删除文件列表
  13. 如何使用给定的部分名称杀死所有进程?
  14. kvm+libvirt虚拟机快照浅析[转]
  15. Orcad Capture CIS 绘制原理图库
  16. 07 -MATLAB数值微积分与方程求解
  17. 中英文标点符号转换-在线工具
  18. 【嵌入式】7段数码管电路原理
  19. 原生js获取一段时间内每隔几分钟的时间数组
  20. CodeForces - 1364D Ehabs Last Corollary(dfs树找最小环)

热门文章

  1. Linux 运维常用命令 find、awk、sed、grep、vi、ps、lsof、rpm
  2. python编程问题--第四次
  3. 超详细中文预训练模型ERNIE使用指南-源码
  4. LeetCode中等题之最简分数
  5. 合肥工业大学—SQL Server数据库实验七:数据查询
  6. NVIDIA GPU上的Tensor线性代数
  7. TensorFlow创建DeepDream网络
  8. 车载网络处理器带来多功能能力
  9. Java map 知识
  10. Android 侧滑栏 (DrawerLayout)