对于模型参数以及模型计算的时候计算量的计算我懂的,但是对于所需要的显存计算,我一脸懵逼。

幸亏看到了一篇较好的文章参考这篇文章(按照这个模型中的方法来计算)

然后基于我目前的一个模型,我计算了下~

写笔记计算了下,基本是这样~

Question:

但是其实我对于原文链接中的下面

这里没想清楚,为什么是这个memory for output这里最后所需要的GPU要乘以2?

此时结合这篇文章再看一下

按道理来说,我们存下中间节点,不管forward 还是backward 都用它就好了吧,这个layer error指的是什么呢?

在backward求导数的时候需要保存下中间值以进行计算。比如 partial L/partial x = partial L/ partial z * (partial z / partial x)

partial z / partial x 这个中间值当然要保留下来以进行计算,所以在backward的时候会占用新的内存~

关于模型训练的时候所需要的GPU显存的计算以及模型参数,计算量的计算相关推荐

  1. 阿里 NIPS 2017 Workshop 论文:基于 TensorFlow 的深度模型训练 GPU 显存优化

    NIPS 2017 在美国长滩举办,场面非常热烈.阿里巴巴一篇介绍深度模型训练 GPU 显存优化的论文<Training Deeper Models by GPU Memory Optimiza ...

  2. Ubuntu下GPU显存无法释放和多卡训练时候的一些总结

    如果我们正在训练模型的时候,强制ctrl+C 结束进程的话,有时候,GPU的显存不会释放, 一般情况下,我们会用nvidia-smi 的命令进行查看哪个进程占用了GPU显存. 但是有时候我们发现不了具 ...

  3. 深度学习模型训练的时候,一般把epoch设置多大?深度模型中的超参数要如何调整?模型训练的诸多问题?

    深度学习模型训练的时候,一般把epoch设置多大? https://www.zhihu.com/question/296266979 1机器学习模型评估混淆矩阵.ROC曲线和AUC以及PR曲线.以及用 ...

  4. PyTorch模型训练完毕后静态量化、保存、加载int8量化模型

    1. PyTorch模型量化方法 Pytorch模型量化方法介绍有很多可以参考的,这里推荐两篇文章写的很详细可以给大家一个大致的参考Pytorch的量化,官方量化文档 Pytorch的量化大致分为三种 ...

  5. 关于GPU显存占满(即memory usage 很大),但GPU-util很小,导致模型训练很慢

    以下两个参数都可以使用nvidia-smi进行查看 GPU内存占用率: GPU内存的占用率往往是由模型大小和batchsize决定的,如果发现GPU占用率很小,比如40%,70%等等.如果此时网络结构 ...

  6. 训练好的神经网络 如何预测_显存不够,如何训练大型神经网络?

    一只小狐狸带你解锁 炼丹术&NLP 秘籍 前阵子微软开源了DeepSpeed训练框架,从测试效果来看有10倍的速度提升,而且对内存进行了各种优化,最大可以训练100B(illion)参数的模型 ...

  7. 训练时GPU显存太小问题、batchsize 的大小跟GPU的显存的关系

    参考链接:https://blog.csdn.net/lien0906/article/details/78863118 问题: tensorflow/core/common_runtime/bfc_ ...

  8. RuntimeError: CUDA out of memory. Tried to allocate 模型训练 GPU 显存不够报错总结

    享受学术探讨的欢乐,传递温暖,希望能够帮助到刚刚入门的同学

  9. 模型占用GPU显存计算

    相关博客: https://blog.csdn.net/wz22881916/article/details/81054036 https://blog.csdn.net/sweetseven_/ar ...

最新文章

  1. Waffles——机器学习开发包
  2. javaweb mysql 连接池 c3p0 配置_C3P0连接池详细配置与实现(2)全局使用
  3. 2014届华为校园招聘机试题
  4. 【Hibernate】Hibernate查询语言HQL详解
  5. iOS 集合的深复制与浅复制
  6. SqlServer动态表查询
  7. PHP仿代下狗源码-素材代下载搜索引擎系统整站打包
  8. 前端项目框架搭建随笔---Tab组件的编写
  9. Unity3D 官方资源包Standard Assets导入
  10. Android 动画
  11. php原创度检测工具,推荐一款不错的伪原创工具
  12. solr全文检索(多字段搜索)
  13. Matlab 仿真——直流电机速度控制(3)PID控制器设计
  14. Deepin 系统没有 Times New Roman 等微软字体
  15. php yield 携程,爬取携程国内地区攻略评论
  16. WS小世界网络的仿真实现
  17. led接口实验微型计算机,微型计算机原来与接口技术实验报告(全)
  18. 全球最大开源软件开发平台和仓库
  19. 多径效应(multipatheffect)
  20. POWER+模块化UPS与传统UPS的比较

热门文章

  1. “辶”“廴”偏旁的字五笔拆字
  2. 东方梅酒:梅见的新国饮故事
  3. 功能自动化测试的策略有哪些?
  4. ps入门教程、ps修图基本工具使用方法视频教学
  5. 小王的智能箱子,看完泪目
  6. CSS学习之圆、半圆、四分之一圆以及三角形的创建
  7. 多项logistic回归系数解释_深入解读Logistic回归结果(一):回归系数,OR
  8. Amazon 发展历程与前景
  9. 进存销管理系统(仓库管理系统)
  10. 社区英雄榜:谁是真正的技术英雄?