1.pth文件中保存的是什么

import torch

state_dict = torch.load("resnet18.pth")

print(type(state_dict))

---------------

如上打印输出所示,pth文件通过有序字典来保持模型参数。有序字典与常规字典一样,但是在排序操作方面有一些额外的功能。常规的dict是无序的,OrderedDict能够比dict更好地处理频繁的重新排序操作。

OrderedDict有一个方法

import torch

state_dict = torch.load("resnet18.pth")

print(type(state_dict))

for i in state_dict:

print(i)

print(type(state_dict[i]))

print("aa:",state_dict[i].data.size())

print("bb:",state_dict[i].requires_grad)

break

------------------------------

conv1.weight

aa: torch.Size([64, 3, 7, 7])

bb: True

如上打印所示,有序字典state_dict中每个元素都是Parameter参数,该参数是一种特殊的张量,包含data和requires_grad两个方法。其中data字段保存的是模型参数,requires_grad字段表示当前参数是否需要进行反向传播。

2.torch.save()

先建立一个字典,保存三个参数:调用torch.save(),即可保存对应的pth文件。需要注意的是若模型是由nn.Moudle类继承的模型,保存pth文件时,state_dict参数需要由model.state_dict指定。

state_dict = {‘net':model.state_dict(), 'optimizer':optimizer.state_dict(), 'epoch':epoch}

torch.save(state_dict , dir)

--------------------------------

torch.save(model.state_dict,dir)

3.torch.load()

当你想恢复某一阶段的训练(或者进行测试)时,那么就可以读取之前保存的网络模型参数等。

checkpoint = torch.load(dir)

model.load_state_dict(checkpoint['net'])

optimizer.load_state_dict(checkpoint['optimizer'])

start_epoch = checkpoint['epoch'] + 1

pytorch保存模型pth_pytorch模型文件pth详解相关推荐

  1. [tensorflow] 模型保存、加载与转换详解

    TensorFlow模型加载与转换详解 本次讲解主要涉及到TensorFlow框架训练时候模型文件的管理以及转换. 首先我们需要明确TensorFlow模型文件的存储格式以及文件个数: model_f ...

  2. OSI 七层模型和TCP/IP模型及对应协议(详解)

    OSI 七层模型和TCP/IP模型及对应协议(详解) 查看全文 http://www.taodudu.cc/news/show-6185847.html 相关文章: OSI7层网络模型协议精析 OSI ...

  3. 【深度学习】扩散模型(Diffusion Model)详解

    [深度学习]扩散模型(Diffusion Model)详解 文章目录 [深度学习]扩散模型(Diffusion Model)详解 1. 介绍 2. 具体方法 2.1 扩散过程 2.2 逆扩散过程 2. ...

  4. Meta最新模型LLaMA细节与代码详解

    Meta最新模型LLaMA细节与代码详解 0. 简介 1. 项目环境依赖 2. 模型细节 2.1 RMS Pre-Norm 2.2 SwiGLU激活函数 2.3 RoPE旋转位置编码 3. 代码解读 ...

  5. C 和 C++ 文件操作详解

    来源:http://www.cnblogs.com/likebeta/archive/2012/06/16/2551662.html 来源:http://www.cnblogs.com/likebet ...

  6. pytorch图像分类篇:6. ResNet网络结构详解与迁移学习简介

    前言 最近在b站发现了一个非常好的 计算机视觉 + pytorch 的教程,相见恨晚,能让初学者少走很多弯路. 因此决定按着up给的教程路线:图像分类→目标检测→-一步步学习用pytorch实现深度学 ...

  7. GprMax 3.1.5 建模的in文件编写详解(2)

    GprMax 3.1.5 建模的in文件编写详解(2) gprMax是一款优秀的基于时域有限差分方法(FDTD)的电磁波数值模拟软件,目前为止,它还没有图形用户界面(GUI),它的建模关键在于in文件 ...

  8. GprMax 3.1.5 建模的in文件编写详解(1)

    GprMax 3.1.5 建模的in文件编写详解(1) gprMax是一款优秀的基于时域有限差分方法(FDTD)的电磁波数值模拟软件,目前为止,它还没有图形用户界面(GUI),它的建模关键在于in文件 ...

  9. Pom.xml文件教程详解

    原创整理不易,转载请注明出处:史上最全的maven pom.xml文件教程详解 代码下载地址:http://www.zuidaima.com/share/1781583829978112.htm   ...

  10. VMware虚拟机文件夹中各文件作用详解

    VMware虚拟机文件夹中各文件作用详解 虚拟机的文件管理由VMware Workstation来执行. 一个虚拟机一般以一系列文件的形式储存在宿主机中, 这些文件一般在由workstation为虚拟 ...

最新文章

  1. DotNetBar12.1新控件——TokenEditor
  2. Boosting(提升方法)之XGBoost
  3. android sd卡列目录文件_Android加载SD卡目录,文件夹遍历,图片设置,设置文件对应打开方式等...
  4. 学好单片机必须要了解的的8个电路设计
  5. Qt移动应用开发(八):实现跨平台的QML和OpenGL混合渲染
  6. 【ElasticSearch】Es 源码之 快照 RepositoriesModule RepositoriesService 源码解读
  7. LSTM block和cell区别
  8. 在win10 python3用pyhive连接hive
  9. 汉仪旗黑vivo版,汉仪旗黑字体全集全新旗黑系列71款
  10. 网络代理之后无法抓包的解决方案
  11. 计算机专业综合理论模拟测试卷五,2020银保监会考试题库:计算机类模拟试题练习(五)...
  12. 萌新带你开车上p站(二)
  13. 集成驱动器LMG3411R150RWHR GaN FET(LMG3410R150RWHR)
  14. 关于汽油清洁剂,到底该不该加
  15. 商人过河c语言编程,商人过河问题C语言源码.c
  16. 【技术推荐】正向角度看Go逆向
  17. WPS如何并排放置两张图片_【爱馨心理协会】WPS抒馨语amp;PS秘诀渡时光——记爱馨心理协会培训会...
  18. 如何写出让 CPU 跑得更快的代码
  19. 关于HTML colgroup 标签介绍
  20. 图神经网络GNN(一): 简单图论与PyG中图数据集的表示及其使用

热门文章

  1. platform_get_resource
  2. P4747 [CERC2017]Intrinsic Interval
  3. windows 系统 工具栏 快速启动
  4. ❤️FFmpeg❤️ MP4格式文件,将MPEG4的编码方式转为H.264
  5. 额定能量不得超过160Wh, 等同是多少mAh电池容量?
  6. 英语语法——句子成分总结
  7. 使用canvas压缩图片
  8. python seo 采集内容_SEO如何处理采集内容(4)–转自{GoGo闯}
  9. 【操作系统】分页式虚拟存储系统
  10. win2003终端服务器超出了最大允许连接数解决方案