AMD深度学习库MIOpen更新,支持CNN加速
农企的深度学习加速库MIOpen 1.0更新了,它现在已经能支持对CNN的加速。
ROCm全称Radeon Open Compute platform,是AMD在去年12月推出的开源GPU运算平台,MIOpen则是AMD为此开发的软件库,其作用是将程序设计语言和ROCm平台连接,以充分利用GCN架构。
此次更新包括:
- 同时为正向和反向传播优化的深度卷积解算器
- 优化的卷积算法,包括Winograd和快速傅立叶转换
- 为深度学习准备的、优化的GEMM
- 池化、Softmax、激活、梯度算法的批量归一化,以及LR Normalization
- 4D张量NCHW格式
- 支持OpenCL和HIP的框架API
- 对MIOpen驱动的支持,以测试任何正向/反向网络
- 支持Ubuntu 16.04和Fedora 24的二进制封装
ROCm支持如下深度学习平台:
是的,没有Theano。
源代码:
https://github.com/ROCmSoftwarePlatform/MIOpen
文档:
MIOpen:
https://rocmsoftwareplatform.github.io/MIOpen/doc/html/apireference.html
MIOpenGemm:
https://rocmsoftwareplatform.github.io/MIOpenGEMM/doc/html/index.html
【完】
AMD深度学习库MIOpen更新,支持CNN加速相关推荐
- python cnn库_AMD深度学习库MIOpen更新,支持CNN加速
农企的深度学习加速库MIOpen 1.0更新了,它现在已经能支持对CNN的加速. ROCm全称Radeon Open Compute platform,是AMD在去年12月推出的开源GPU运算平台,M ...
- 小样本点云深度学习库_NeurIPS2019 | MIT与上海交大提出新型点云深度学习框架Point-Voxel CNN...
首发于公众号:3D点云深度学习. 论文:'Point-Voxel CNN for Efficient 3D Deep Learning' 来源:NeurIPS2019Spotlight 共同一作:Zh ...
- 使用方法 yii_如何实现高速卷积?深度学习库使用了这些黑魔法
选自github.io 作者:Manas Sahni 机器之心编译 参与:魔王 使用深度学习库可以大幅加速CNN模型运行,那么这些库中的哪些具体的做法实现了这种高速度和高性能呢?佐治亚理工学院计算机科 ...
- 如何实现高速卷积?深度学习库使用了这些「黑魔法」
点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 来源:公众号 机器之心 授权转载 使用深度学习库可以大幅加速CNN ...
- 【干货小铺】各种编程语言的深度学习库整理
点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达本文转自|新机器视觉 本文总结了Python.Matlab.CPP. ...
- 各种编程语言的深度学习库整理
Python 1. Theano是一个python类库,用数组向量来定义和计算数学表达式.它使得在Python环境下编写深度学习算法变得简单.在它基础之上还搭建了许多类库. 1.Keras是一个简洁. ...
- 各种编程语言的深度学习库整理(中英版)
本文总结了Python.Matlab.CPP.Java.JavaScript.Lua.Julia.Lisp.Haskell..NET.R等语言的深度学习库,赶紧收藏吧! Python 1. Thean ...
- 涵盖各种编程语言的深度学习库整理大全!
Python 1. Theano是一个python类库,用数组向量来定义和计算数学表达式.它使得在Python环境下编写深度学习算法变得简单.在它基础之上还搭建了许多类库. 1.Keras是一个简洁. ...
- 微软亚马逊联手发布深度学习库Gluon,适合所有段位的炼丹师
安妮 编译整理 量子位 出品 | 公众号 QbitAI 昨天,亚马逊AWS和微软共同宣布推出深度学习库Gluon.Gluon为各种水平的深度学习开发人员设计,帮助炼丹师们在云端.App和其他设备上设计 ...
最新文章
- Nature Methods | 用深度多任务神经网络探索单细胞数据
- yii2 请求外部api_微服务架构之「 API网关 」
- dqn在训练过程中loss越来越大_DQN算法实现注意事项及排错方法
- HNOI2008 GT考试 (KMP + 矩阵乘法)
- JLink v8固件丢失修复教程
- Anaconda使用pyinstaller打包exe程序体积过大
- [LOJ 6485]LJJ 学二项式定理
- 网易校招——魔法币问题
- AttributeError: ‘str‘ object has no attribute ‘decode‘ model = keras.models.load_model
- Vue:打印组件PrintPage
- Linux scipy安装
- Linux-发送邮件
- 用python实现小说的平均句长,词性占比,关键词,标点符号,词形统计
- OpenGL三维图形编程技术(转)
- linux+qt4.8画波形图,Qt画笔实现波形区域图
- java excel 导入 加校验_【JavaWeb】导入Excel并进行校验
- 如何推导欧拉公式e^iθ=cosθ+i*sinθ
- 实验!实验!还是实验!
- 记一次http下载0KB问题的解决
- 关于ArcGIS一运行ArcToolbox就闪退问题的两种可能性和解决方案
热门文章
- jpa 人大金仓数据库方言_KingBaseV8人大金仓数据库 | 大小写敏感问题
- authentication method mysql 8.0查询_mysql 索引整理
- mysql 部署在私有云_教你在 RHEL 7 中部署私有云网盘
- android如何开发ui服务,Android UI-对Activity工作流程的理解(一)
- ssh 连接linux 乱码问题,SSH 连接 Ubuntu 时的中文乱码问题
- c# mysql 汉字乱码_在C#和MySQL中存取中文字符时避免乱码的方法
- 指定tomcat运行时的JDK版本
- VB 去除文本框粘贴功能
- 如何批量处理Word中的图片大小
- 老黄投下新核弹:英伟达十年力作图灵架构,新GPU支持光线追踪