总结了三种权重的初始化方法,前两种比较常见,后一种是最新的。

1. Gaussian

Weights are randomly drawn from Gaussian distributions with fixed mean (e.g., 0) and fixed standard deviation (e.g., 0.01).

This is the most common initialization method in deep learning.

2. Xavier

This method proposes to adopt a properly scaled uniform or Gaussian distribution for initialization.

In Caffe (an openframework for deep learning) [2], It initializes the weights in network by drawing them from a distribution with zero mean and a specific variance,

Where W  is the initialization distribution for the neuron in question, and   n_in is the number of neurons feeding into it. The distribution used is typically Gaussian or uniform.

In Glorot & Bengio’s paper [1], itoriginally recommended using

Where n_out is the number of neurons the result is fed to.

Reference:

[1] X. Glorot and Y. Bengio. Understanding the difficulty of training deepfeedforward neural networks. In International Conference on Artificial Intelligence and Statistics, pages 249–256, 2010.

[2] Y. Jia, E. Shelhamer, J. Donahue, S. Karayev, J. Long, R. Girshick, S.Guadarrama, and T. Darrell. Caffe: Convolutional architecture for fast featureembedding. arXiv:1408.5093, 2014.

3. MSRA

This method is proposed to solve the training of extremely deep rectified models directly from scratch [1].

In this method,weights are initialized with a zero-mean Gaussian distribution whose std is

Where  is the spatial filter size in layer l and d_l−1 is the number of filters in layer l−1.

Reference:
[1]
 Kaiming He, Xiangyu Zhang, Shaoqing Ren, and Jian Sun. Delving Deep into Rectifiers: Surpassing Human-Level Performance on ImageNet Classification, Technical report, arXiv, Feb. 2015

三种权重的初始化方法相关推荐

  1. DL之DNN优化技术:自定义MultiLayerNet【5*100+ReLU】对MNIST数据集训练进而比较三种权重初始值(Xavier参数初始化、He参数初始化)性能差异

    DL之DNN优化技术:自定义MultiLayerNet[5*100+ReLU]对MNIST数据集训练进而比较三种权重初始值(Xavier参数初始化.He参数初始化)性能差异 导读 #思路:观察不同的权 ...

  2. 总结几种结构体初始化方法 (转)

    结构体能自由组装数据,是一种很常见的数据打包方法.当我们定义一个结构体后,没有初始化就使用,就会使用到垃圾数据,而且这种错误很难发现.对于定义的任何变量,我们最好都先初始化. 除了使用memset和Z ...

  3. day01 js三种导入html的方法、js书写规范、变量的基本使用、变量提升

    昨天是初学js的第一天,为什么今天才写,我觉得这样可以帮助我复习昨天的知识,加深对js的理解. 我之前学过java的,昨天转入js的学习,对js略有些体会和大家分享下,js刚入门感觉js相对于java ...

  4. (转)Putty server refused our key的三种原因和解决方法

    (转)Putty server refused our key的三种原因和解决方法 参考文章: (1)(转)Putty server refused our key的三种原因和解决方法 (2)http ...

  5. tomcat中三种部署项目的方法(转)

    tomcat中三种部署项目的方法 第一种方法:在tomcat中的conf目录中,在server.xml中的,<host/>节点中添加:  <Context path="/h ...

  6. QT中三种构建菜单栏的方法

    QT中三种构建菜单栏的方法 方法1 <C++ GUI programming with Qt 4, Second Edition>给出的一种方法:QMenum定义单个菜单,调用menuBa ...

  7. java .class 实例对象_Java产生Class类的三种实例化对象的方法

    Java产生Class类的三种实例化对象的方法 1.object.getClass 2.类名.class直接根据某个具体的类来取得Class实例化对象 3.Class.forName(String c ...

  8. win7计算机名怎么是感叹号,Win7连接wifi信号后出现感叹号三种原因和解决方法

    Win7系统电脑连接网络上网的方式有很多种,比如拨号.无线wifi.网卡等等,有时候网络也会出现故障问题.这不Win7连接wifi出现感叹号,并且提示有限的访问权限,且无法上网.有什么办法能解决,让w ...

  9. win7计算机名怎么是感叹号,Win7系统wifi信号后出现感叹号怎么办 Win7连接wifi后出现感叹号三种原因和解决方法...

    Win7连接wifi出现感叹号,并且提示有限的访问权限,且无法上网.有什么办法能解决,让win7系统能够正常连接网络呢?针对Win7连接wifi信号后出现感叹号的问题,下面脚本之家的小编给大家讲解具体 ...

最新文章

  1. Python Re 模块超全解读!详细
  2. java 增强for循环(foreach)
  3. docker 厂商 容器_中国容器厂商综合实力排名,新鲜出炉!
  4. 虚拟机ping不通开发板如何解决
  5. TurboMail邮件系统通过涉密信息系统产品认定
  6. 高斯粒子滤波matlab,粒子滤波(Particle filter)matlab实现 | 学步园
  7. Action重定向总结
  8. 【MySQL】【高可用】从masterha_master_switch工具简单分析MHA的切换逻辑
  9. 2.2使用urllib的简单传输
  10. Java中上转型对象数组
  11. 修改R语言安装包的默认路径 r包安装位置
  12. 三菱plc指令dediv_三菱PLC指令[]学习指导书.ppt
  13. Ubuntu恢复被删除的文件
  14. 试验设计系列(二)| 随机分组
  15. 一篇文章带你深入理解 Java 中的Class.getClassLoader
  16. HDU - 6609
  17. 喜欢上Cinnamon的10个理由
  18. GBase 8a 高可用集群同城双活灾备方案
  19. 递归算法与非递归算法的转化
  20. 使用 Coinbase 在 Polygon 网络上获取 MATIC

热门文章

  1. apache kafka源码分析-Producer分析---转载
  2. 深入分析 iBATIS 框架之系统架构与映射原理--转载
  3. XGBoost缺失值引发的问题及其深度分析
  4. 无约束最优化方法-牛顿法
  5. 信贷类行业对于业务管理系统搭建如何下手
  6. Chromium:编译,运行
  7. jvm性能调优 - 03垃圾回收机制
  8. 云起智慧中心连接华为_云起LifeSmart全系接入HUAWEI HiLink生态系统
  9. hamming weight_popcount或者hamming weight(二进制1的个数问题)
  10. matlab里矩阵相除,Matlab中的矩阵除法有问题???