在神经网络中,通常需要随机初始化模型参数。下面解释一下这样做的原因。

设有一个多层感知机模型,假设输出层只保留一个输出单元o1o_1o1​,且隐藏层使用相同的激活函数。如果将每个隐藏单元的参数都初始化为相等的值,那么在正向传播时每个隐藏单元将根据相同的输入计算出相同的值,并传递至输出层。

在反向传播中,每个隐藏单元的参数梯度值相等。因此,这些参数在使用基于梯度的优化算法迭代后值依然相等。之后的迭代也是如此。在这种情况下,无论隐藏单元有多少,隐藏层本质上只有一个隐藏单元在发挥作用。

因此,通常对神经网络的模型参数,特别是权重参数进行随机初始化。随机初始化模型参数的方法有很多,可以使用正态分布的随机初始化方式。

还有一种比较常用的随机初始化方法叫做Xavier随机初始化。假设某全连接层的输入个数为a,输出个数为b,Xavier随机初始化将使该层中权重参数的每个元素都随机采样于均匀分布U(−6a+b,6a+b)U(-\sqrt{\frac{6}{a+b}},\sqrt{\frac{6}{a+b}})U(−a+b6​​,a+b6​​)它的设计主要考虑到,模型参数初始化后,每层输出的方差不该受该层输入个数影响,且每层梯度的方差也不该受该层输出个数影响。

神经网络为什么需要随机初始化模型参数相关推荐

  1. 访问模型参数,初始化模型参数,共享模型参数方法

    一. 访问模型参数 对于使用Sequential类构造的神经网络,我们可以通过方括号[]来访问网络的任一层.回忆一下上一节中提到的Sequential类与Block类的继承关系. 对于Sequenti ...

  2. 初始化模型参数 python_pytorch 网络参数 weight bias 初始化详解_python_脚本之家

    权重初始化对于训练神经网络至关重要,好的初始化权重可以有效的避免梯度消失等问题的发生. 在pytorch的使用过程中有几种权重初始化的方法供大家参考. 注意:第一种方法不推荐.尽量使用后两种方法. # ...

  3. sklearn随机森林模型参数解释

    n_estimators ​ 随机森林决策树的数目,n_estimators越大越好,但占用的内存与训练和预测的时间也会相应增长,且边际效益是递减的,所以要在可承受的内存/时间内选取尽可能大的n_es ...

  4. 在真实数据集上的随机森林模型参数调优

    向AI转型的程序员都关注了这个号

  5. [pytorch、学习] - 4.2 模型参数的访问、初始化和共享

    参考 4.2 模型参数的访问.初始化和共享 在3.3节(线性回归的简洁实现)中,我们通过init模块来初始化模型的参数.我们也介绍了访问模型参数的简单方法.本节将深入讲解如何访问和初始化模型参数,以及 ...

  6. (pytorch-深度学习系列)模型参数的初始化与访问操作-学习笔记

    模型参数的初始化与访问操作 学习 如何初始化以及访问模型参数,以及如何在多层之间共享模型参数 首先定义一个含有单个隐藏层的多层感知机,使用默认方式初始化该模型的参数,并且进行一次前向计算: impor ...

  7. 吴恩达深度学习 —— 3.11 随机初始化

    当你训练神经网络的时候,随机初始化权重非常重要,对于逻辑回归,可以将权重初始化为零,但如果将神经网络的各参数数组全部初始化为0,再使用梯度下降算法那会完全无效,让我们看看是什么原因. 如上图,神经网络 ...

  8. MXNET:深度学习计算-模型参数

    我们将深入讲解模型参数的访问和初始化,以及如何在多个层之间共享同一份参数. 之前我们一直在使用默认的初始函数,net.initialize(). from mxnet import init, nd ...

  9. 神经网络的模型参数调优的方法有哪些

    神经网络参数如何确定 神经网络各个网络参数设定原则:①.网络节点  网络输入层神经元节点数就是系统的特征因子(自变量)个数,输出层神经元节点数就是系统目标个数.隐层节点选按经验选取,一般设为输入层节点 ...

最新文章

  1. 统一沟通-技巧-10-Lync-公网证书-Go Daddy
  2. URL加随机数的作用
  3. expdp oracle 并行_oracle 11g逻辑备份介绍-expdp/impdp
  4. T4文本模板转换过程
  5. Error:依赖版本不一致
  6. 2018年第九届蓝桥杯 第五题:快速排序 (满分9分)
  7. Tensorflow深度学习应用(进阶篇)-回归(函数拟合训练)-可视化
  8. 证书体系: PFX 文件格式解析
  9. 利用ipsec配置tcp/ip用于安全连接
  10. java 一个大事务下的新增、修改、查询_一文带你轻松搞懂事务隔离级别(图文详解)...
  11. 柔性电子综述2014:Wearable Electronics and Smart Textiles 可穿戴电子设备
  12. 中台方法论及案例集合
  13. 分享一个特别好用的时间选择控件
  14. Revit模型如何在网页上显示
  15. TCP原理之:linux网桥
  16. 免费Bootstrap后台管理模板
  17. 做淘宝产品标题要找蓝海关键词
  18. AMR SLAM ROS入门——前言
  19. 2020年煤矿安全监测监控新版试题及煤矿安全监测监控复审考试
  20. 【2022年度总结与2023展望】---22年故事不长,且听我来讲

热门文章

  1. Oracle归档日志与非归档日志的切换及路径设置
  2. Redis面试 - Redis的持久化机制
  3. idea的总部_Studio Didea新总部办公室,意大利 / Studio Didea
  4. 【C#学习之旅】一、数据类型
  5. crontab -e 报错(E518: Unknown option: foldenable)
  6. C#LeetCode刷题之#844-比较含退格的字符串​​​​​​​(Backspace String Compare)
  7. 利用Github搭建免费图床
  8. css 网格布局_CSS网格布局
  9. alexa技能个数_如何改善Alexa技能的对话流程
  10. react hooks_React Hooks简介