参数初始化的目的是限定网络权重参数的初始分布,试图让权重参数更接近参数空间的最优解,从而加速训练。pytorch中网络默认初始化参数为随机均匀分布,设定额外的参数初始化并非总能加速训练。

1,模板

在训练开始对指定层的权重或偏置初始化:

def weight_init(m):if isinstance(m, (nn.Conv2d, nn.Linear)):nn.init.kaiming_normal_(m.weight)elif isinstance(m, nn.BatchNorm2d):m.weigth.data.fill_(1)m.bias.data.zero_()model.apply(weight_init)

2,pytorch自带的参数初始化方法

torch.nn.init.
uniform(tensor, a=0, b=1) 均匀分布,下限a,上限b
normal(tensor, mean=0, std=1)正态分布
constant(tensor, val)常数值
xavier_uniform(w, gain=math.sqrt(2.0))
xavier_normal(tensor, gain=1)
kaiming_uniform(tensor, a=0, mode=‘fan_in’)
kaiming_normal(tensor, a=0, mode=‘fan_in’)
orthogonal(tensor, gain=1)正交矩阵

Pytorch基础知识整理(六)参数初始化相关推荐

  1. pytorch基础知识整理(五) 优化器

    深度学习网络必须通过优化器进行训练.在pytorch中相关代码位于torch.optim模块中. 1, 常规用法 optimizer = torch.optim.Adam(model.paramete ...

  2. pytorch基础知识整理(一)自动求导机制

    torch.autograd torch.autograd是pytorch最重要的组件,主要包括Variable类和Function类,Variable用来封装Tensor,是计算图上的节点,Func ...

  3. pytorch基础知识整理(二)数据加载

    pytorch数据加载组件位于torch.utils.data中. from torch.utils.data import DataLoader, Dataset, Sampler 1, torch ...

  4. pytorch基础知识整理(四) 模型

    1,模型构造模板 torch.nn.Module()是所有网络模型的基类,所有网络都需要继承此类,模板如下: import torch.nn as nn import torch.nn.functio ...

  5. pytorch基础知识整理(三)模型保存与加载

    1, torch.save(); troch.load() torch.save()使用python的pickle模块把目标保存到磁盘,可以用来保存模型.张量.字典等,文件后缀名一般用pth或pt或p ...

  6. centos7创建asm磁盘_Oracle ASM 磁盘组基础知识整理(收藏版)

    为什么要写这么一篇基础知识呢?还是有那么一点点原因的,不是胡编乱造还真是有真实存在的事件的,前两周里因一套生产环境数据库磁盘不足无法对其进行表空间扩容,需要向存储岗申请存储资源,当存储岗划好资源加完存 ...

  7. HTML5的基础知识整理

    HTML5 概述:HTML5是HTML最新的修订版本,2014年10月由万维网联盟(W3C)完成标准制定. HTML5的设计目的是为了在移动设备上支持多媒体. 文章目录 HTML5 前言 一.HTMl ...

  8. python常用变量名_python基础知识整理

    Python Python开发 Python语言 python基础知识整理 序言:本文简单介绍python基础知识的一些重要知识点,用于总结复习,每个知识点的具体用法会在后面的博客中一一补充程序: 一 ...

  9. 前端基础知识整理汇总(上)

    前端基础知识整理汇总(上) HTML页面的生命周期 HTML页面的生命周期有以下三个重要事件: 1.DOMContentLoaded -- 浏览器已经完全加载了 HTML,DOM 树已经构建完毕,但是 ...

最新文章

  1. UTRAN 的用户面和控制面
  2. linux ico图标大小,带、你了解ico图标文件格式
  3. leetcode算法题--礼物的最大价值
  4. 学习OGRE - 读取天龙八部scene文件
  5. 带你走进SAP项目实施过程——立项
  6. STL 之search,search_n,sort,binary_search
  7. 2013年,6月20日,今天非常无聊啊。
  8. tomcat日志中出现乱码
  9. asp.net mvc源码分析-Action篇 DefaultModelBinder
  10. 计算机应用基础实例,计算机应用基础案例教程(Windows 7+Office 2010)
  11. opencv-3.4.2-vc14_vc15.exe 下载
  12. C#如何查看DLL文件中的成员
  13. android自动计步_自动计步器app下载
  14. 计算机网络实验水晶头,计算机网络实验报告制作网线
  15. 希望各位dalao不吝赐教
  16. cmake学习笔记--cmake的打印、创建工程等基本操作(1)
  17. hgetall php,HGETALL命令_视频讲解_用法示例-redis编程词典-php中文网
  18. 孙宇晨为恶俗炒作道歉;华为回应美国子公司裁员 600
  19. 最全软件著作权申请流程
  20. Google公共电话号码解析库: libphonenumber

热门文章

  1. python如何打开一个大文件?
  2. Android逆向基础----Android Dalvik虚拟机
  3. 用户体验分析: 以 “南通市图书馆微信公众号” 为例
  4. poj3666 Making the Grade
  5. 基于CkEditor实现.net在线开发之路(1)
  6. 安装phproject之一
  7. pythonjs设置_python dom操作
  8. 撰写科技奖励申报材料的“思路”“要点”与“技巧”
  9. 近期低分纯生信友好的期刊简介
  10. Endnote技巧:解决中英参考文献混排问题,附国标文件