CUDA、CUDNN跑卷积神经网络报错CUDA error: CUBLAS_STATUS_EXECUTION_FAILED和CUDNN_STATUS_EXECUTION_FAILED
笔者跑神经网络的时候遇到显存溢出问题。
系统:Ubuntu 16.04
CUDA:10.0.130
CUDNN:7.6.4.38
Python:3.6.12
PYTORCH: 1.2
TORCHVISION: 0.4
卷积神经网络的代码用CPU跑没问题,但是用CUDA+CUDNN跑报错:
RuntimeError: cuDNN error: CUDNN_STATUS_EXECUTION_FAILED
载入参数前,加上语句:
torch.backends.cudnn.enabled = False
禁用CUDNN跑,报错:
RuntimeError: CUDA error: CUBLAS_STATUS_EXECUTION_FAILED when calling `cublasSgemm( handle, opa, opb, m, n, k, &alpha, a, lda, b, ldb, &beta, c, ldc)`
试着换CUDA和CUDNN版本:
CUDA: 11.1.105
CUDNN
Python: 3.6.6
PYTORCH: 1.8
TORCHVISION: 0.9
BATCHSIZE:64
CUDA+CUDNN跑报错:
RuntimeError: CUDA out of memory. Tried to allocate 392.00 MiB (GPU 0; 7.79 GiB total capacity; 5.32 GiB already allocated; 307.25 MiB free; 5.33 GiB reserved in total by PyTorch)
屏蔽CUDNN也报错:
RuntimeError: CUDA out of memory. Tried to allocate 56.00 MiB (GPU 0; 7.79 GiB total capacity; 5.46 GiB already allocated; 70.81 MiB free; 5.48 GiB reserved in total by PyTorch)
在网上搜,说在报错语句前后加清理缓存的语句:
if hasattr(torch.cuda, 'empty_cache'):torch.cuda.empty_cache()
还是没解决。
这个问题是显存不足,除了换显卡之外,修改模型大小可能是比较好的解决方法。
最后,BATCHSIZE改为8,运行成功。
CUDA、CUDNN跑卷积神经网络报错CUDA error: CUBLAS_STATUS_EXECUTION_FAILED和CUDNN_STATUS_EXECUTION_FAILED相关推荐
- tez引擎跑hive 语句报错问题解决
tez引擎跑hive 语句报错问题解决 现象: Container [pid=151320,containerID=***] is running beyond physical memory lim ...
- windows10下编译dllib报错: ERROR: Failed building wheel for dlib
一.报错信息 在安装dlib的时候,使用pip进行安装 pip install dlib 二.解决方式 1.检查自己是否已经安装了cmake 首先要检测自己本机是否已经安装了cmake,因为安装dli ...
- python 安装pytorch apex 报错:“ERROR: Command errored out with exit status 1: /home/litt/anaconda3/envs/”
1.安装错误 安装apex库时,执行安装 pip install -v --disable-pip-version-check --no-cache-dir --global-option=" ...
- 【c语言 gcc9.1.0环境下编译报错】error: ‘true’ undeclared (first use in this function)
问题 网上验证一个单链表是否有环的c语言demo,放到gcc9.1.0的环境下编译,发现编译报错: error: 'true' undeclared (first use in this functi ...
- linux下unzip解压报错“symlink error: File name too long”怎么办?提供解决方案。
点击上方↑↑↑蓝字[协议分析与还原]关注我们 " 分享unzip工具的一个bug." 最近在研究菠菜站,中间用到了Spidermonkey,碰到一些小波折,在这里分享出来,以便大家 ...
- redis设置主从复制-slave Replication--解决报错:(error) READONLY You can't write against a read only slave.
我的个人博客:zhang0peter的个人博客 主节点按照我上篇文章的内容配好redis后就可以了:ubuntu, debian 安装redis,设置开机自动启动和密码,允许外网访问 在从节点安装好r ...
- Sublime Text 3便携版下载安装和常用插件安装--顺便解决报错An error occured installing和no packages available for install
文章目录 Sublime Text 3便携版下载安装和常用插件安装 1.Sublime Text 3便携版下载: 2.sublime 插件控制器(Package Control)安装 2.1离线安装P ...
- SAP LSMW 事务代码HUPAST的录屏后台执行报错 - Runtime error RAISE_EXCEPTION has occurred - 之分析
SAP LSMW 事务代码HUPAST的录屏后台执行报错 - Runtime error RAISE_EXCEPTION has occurred - 之分析 因项目上成品库存管理启用了handlin ...
- Vue报错:Error while running task D:\vue\forum:build with message‘spawn vue-cli-service ENOENT‘
Vue报错:Error while running task D:\vue\vueforum\forum:build with message'spawn vue-cli-service ENOENT ...
最新文章
- MySQL-数据库监控初探
- 使用Nodejs搭建server
- 英特尔发布其首个适配Win11的显卡驱动
- stm32 引脚功能重复_STM32的复用时钟何时开启?
- 【debug】requests.exceptions.ChunkedEncodingError: (‘Connection broken: IncompleteRead(0 bytes read)‘
- 前端:JS/23/JS内置对象(String对象,Array对象,Date对象,Boolean对象,Number对象,Math对象),实例:求圆的面积,求直角三角形
- php什么集成框架比较好,php哪个框架比较好?
- SpringBoot + MyBatis + Thymeleaf 之 HelloWorld
- Html 小插件4 百度搜索代码
- 办公、学习不得不收藏的十个网站,有了它效率至少提升十倍
- 入侵检测:User-Agent
- 苹果系统怎么链接共享服务器,mac连接共享服务器设置
- 使用C语言求斐波那契(Fibonacci)数列的第n项
- Linux 系统进程守护工具 cesi + superviosr
- air报错 Context3D not available. fd as3项目默认不开启gpu加速的问题
- 2019尚硅谷大数据Javaweb篇三 Ajax、JSTL、会话技术、过滤器、监听器、xml、json
- 极简主义!让手机壁纸,惊现高级脸Feel~
- 【直播活动】阿里巴巴开源大家族加入中科院开源之夏2022
- 九、android的ListView实现数据列表展示
- 初等数论知识(附证明)
热门文章
- Axure 点图片外区域即隐藏_学英语还可以这么有趣?快陪孩子一起找图片吧!(可打印)|英语|英语启蒙|儿歌|图画|闪卡...
- Microsemi Libero使用技巧6——FPGA全局网络的设置
- 文献管理软件Mendeley的优缺点以及下载安装
- 动态代理(1,umeng 自定义事件的统计,2,非侵入式的性能测量方法 )
- python画一个点_python – 如何绘制一个数据点?
- perl dbi mysql windows_PERL与MySQL(DBI接口)
- [云开发2]-快速开发一个问卷调查云应用(前端)
- (三)代表性物质点邻域的变形分析
- ppt中批量替换字体 没有被替换目标字体的解决办法
- 基于ssm的仓库进销存管理系统的设计开发作品欣赏