笔者跑神经网络的时候遇到显存溢出问题。

系统:Ubuntu 16.04
CUDA:10.0.130
CUDNN:7.6.4.38
Python:3.6.12
PYTORCH: 1.2
TORCHVISION: 0.4

卷积神经网络的代码用CPU跑没问题,但是用CUDA+CUDNN跑报错:

RuntimeError: cuDNN error: CUDNN_STATUS_EXECUTION_FAILED

载入参数前,加上语句:

torch.backends.cudnn.enabled = False

禁用CUDNN跑,报错:

RuntimeError: CUDA error: CUBLAS_STATUS_EXECUTION_FAILED when calling `cublasSgemm( handle, opa, opb, m, n, k, &alpha, a, lda, b, ldb, &beta, c, ldc)`

试着换CUDA和CUDNN版本:
CUDA: 11.1.105
CUDNN
Python: 3.6.6
PYTORCH: 1.8
TORCHVISION: 0.9
BATCHSIZE:64

CUDA+CUDNN跑报错:

RuntimeError: CUDA out of memory. Tried to allocate 392.00 MiB (GPU 0; 7.79 GiB total capacity; 5.32 GiB already allocated; 307.25 MiB free; 5.33 GiB reserved in total by PyTorch)

屏蔽CUDNN也报错:

RuntimeError: CUDA out of memory. Tried to allocate 56.00 MiB (GPU 0; 7.79 GiB total capacity; 5.46 GiB already allocated; 70.81 MiB free; 5.48 GiB reserved in total by PyTorch)

在网上搜,说在报错语句前后加清理缓存的语句:

if hasattr(torch.cuda, 'empty_cache'):torch.cuda.empty_cache()

还是没解决。

这个问题是显存不足,除了换显卡之外,修改模型大小可能是比较好的解决方法。

最后,BATCHSIZE改为8,运行成功。

CUDA、CUDNN跑卷积神经网络报错CUDA error: CUBLAS_STATUS_EXECUTION_FAILED和CUDNN_STATUS_EXECUTION_FAILED相关推荐

  1. tez引擎跑hive 语句报错问题解决

    tez引擎跑hive 语句报错问题解决 现象: Container [pid=151320,containerID=***] is running beyond physical memory lim ...

  2. windows10下编译dllib报错: ERROR: Failed building wheel for dlib

    一.报错信息 在安装dlib的时候,使用pip进行安装 pip install dlib 二.解决方式 1.检查自己是否已经安装了cmake 首先要检测自己本机是否已经安装了cmake,因为安装dli ...

  3. python 安装pytorch apex 报错:“ERROR: Command errored out with exit status 1: /home/litt/anaconda3/envs/”

    1.安装错误 安装apex库时,执行安装 pip install -v --disable-pip-version-check --no-cache-dir --global-option=" ...

  4. 【c语言 gcc9.1.0环境下编译报错】error: ‘true’ undeclared (first use in this function)

    问题 网上验证一个单链表是否有环的c语言demo,放到gcc9.1.0的环境下编译,发现编译报错: error: 'true' undeclared (first use in this functi ...

  5. linux下unzip解压报错“symlink error: File name too long”怎么办?提供解决方案。

    点击上方↑↑↑蓝字[协议分析与还原]关注我们 " 分享unzip工具的一个bug." 最近在研究菠菜站,中间用到了Spidermonkey,碰到一些小波折,在这里分享出来,以便大家 ...

  6. redis设置主从复制-slave Replication--解决报错:(error) READONLY You can't write against a read only slave.

    我的个人博客:zhang0peter的个人博客 主节点按照我上篇文章的内容配好redis后就可以了:ubuntu, debian 安装redis,设置开机自动启动和密码,允许外网访问 在从节点安装好r ...

  7. Sublime Text 3便携版下载安装和常用插件安装--顺便解决报错An error occured installing和no packages available for install

    文章目录 Sublime Text 3便携版下载安装和常用插件安装 1.Sublime Text 3便携版下载: 2.sublime 插件控制器(Package Control)安装 2.1离线安装P ...

  8. SAP LSMW 事务代码HUPAST的录屏后台执行报错 - Runtime error RAISE_EXCEPTION has occurred - 之分析

    SAP LSMW 事务代码HUPAST的录屏后台执行报错 - Runtime error RAISE_EXCEPTION has occurred - 之分析 因项目上成品库存管理启用了handlin ...

  9. Vue报错:Error while running task D:\vue\forum:build with message‘spawn vue-cli-service ENOENT‘

    Vue报错:Error while running task D:\vue\vueforum\forum:build with message'spawn vue-cli-service ENOENT ...

最新文章

  1. MySQL-数据库监控初探
  2. 使用Nodejs搭建server
  3. 英特尔发布其首个适配Win11的显卡驱动
  4. stm32 引脚功能重复_STM32的复用时钟何时开启?
  5. 【debug】requests.exceptions.ChunkedEncodingError: (‘Connection broken: IncompleteRead(0 bytes read)‘
  6. 前端:JS/23/JS内置对象(String对象,Array对象,Date对象,Boolean对象,Number对象,Math对象),实例:求圆的面积,求直角三角形
  7. php什么集成框架比较好,php哪个框架比较好?
  8. SpringBoot + MyBatis + Thymeleaf 之 HelloWorld
  9. Html 小插件4 百度搜索代码
  10. 办公、学习不得不收藏的十个网站,有了它效率至少提升十倍
  11. 入侵检测:User-Agent
  12. 苹果系统怎么链接共享服务器,mac连接共享服务器设置
  13. 使用C语言求斐波那契(Fibonacci)数列的第n项
  14. Linux 系统进程守护工具 cesi + superviosr
  15. air报错 Context3D not available. fd as3项目默认不开启gpu加速的问题
  16. 2019尚硅谷大数据Javaweb篇三 Ajax、JSTL、会话技术、过滤器、监听器、xml、json
  17. 极简主义!让手机壁纸,惊现高级脸Feel~
  18. 【直播活动】阿里巴巴开源大家族加入中科院开源之夏2022
  19. 九、android的ListView实现数据列表展示
  20. 初等数论知识(附证明)

热门文章

  1. Axure 点图片外区域即隐藏_学英语还可以这么有趣?快陪孩子一起找图片吧!(可打印)|英语|英语启蒙|儿歌|图画|闪卡...
  2. Microsemi Libero使用技巧6——FPGA全局网络的设置
  3. 文献管理软件Mendeley的优缺点以及下载安装
  4. 动态代理(1,umeng 自定义事件的统计,2,非侵入式的性能测量方法 )
  5. python画一个点_python – 如何绘制一个数据点?
  6. perl dbi mysql windows_PERL与MySQL(DBI接口)
  7. [云开发2]-快速开发一个问卷调查云应用(前端)
  8. (三)代表性物质点邻域的变形分析
  9. ppt中批量替换字体 没有被替换目标字体的解决办法
  10. 基于ssm的仓库进销存管理系统的设计开发作品欣赏