本文来自AI新媒体量子位(QbitAI)

农企的深度学习加速库MIOpen 1.0更新了,它现在已经能支持对CNN的加速。

ROCm全称Radeon Open Compute platform,是AMD在去年12月推出的开源GPU运算平台,MIOpen则是AMD为此开发的软件库,其作用是将程序设计语言和ROCm平台连接,以充分利用GCN架构。

此次更新包括:

  • 同时为正向和反向传播优化的深度卷积解算器
  • 优化的卷积算法,包括Winograd和快速傅立叶转换
  • 为深度学习准备的、优化的GEMM
  • 池化、Softmax、激活、梯度算法的批量归一化,以及LR Normalization
  • 4D张量NCHW格式
  • 支持OpenCL和HIP的框架API
  • 对MIOpen驱动的支持,以测试任何正向/反向网络
  • 支持Ubuntu 16.04和Fedora 24的二进制封装

ROCm支持如下深度学习平台:

是的,没有Theano。

源代码:
https://github.com/ROCmSoftwarePlatform/MIOpen

文档:

MIOpen:
https://rocmsoftwareplatform.github.io/MIOpen/doc/html/apireference.html

MIOpenGemm:
https://rocmsoftwareplatform.github.io/MIOpenGEMM/doc/html/index.html

【完】

本文作者:吴唯
原文发布时间:2017-07-03

AMD深度学习库MIOpen更新,支持CNN加速相关推荐

  1. python cnn库_AMD深度学习库MIOpen更新,支持CNN加速

    农企的深度学习加速库MIOpen 1.0更新了,它现在已经能支持对CNN的加速. ROCm全称Radeon Open Compute platform,是AMD在去年12月推出的开源GPU运算平台,M ...

  2. 小样本点云深度学习库_NeurIPS2019 | MIT与上海交大提出新型点云深度学习框架Point-Voxel CNN...

    首发于公众号:3D点云深度学习. 论文:'Point-Voxel CNN for Efficient 3D Deep Learning' 来源:NeurIPS2019Spotlight 共同一作:Zh ...

  3. 使用方法 yii_如何实现高速卷积?深度学习库使用了这些黑魔法

    选自github.io 作者:Manas Sahni 机器之心编译 参与:魔王 使用深度学习库可以大幅加速CNN模型运行,那么这些库中的哪些具体的做法实现了这种高速度和高性能呢?佐治亚理工学院计算机科 ...

  4. 如何实现高速卷积?深度学习库使用了这些「黑魔法」

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 来源:公众号 机器之心 授权转载 使用深度学习库可以大幅加速CNN ...

  5. 【干货小铺】各种编程语言的深度学习库整理

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达本文转自|新机器视觉 本文总结了Python.Matlab.CPP. ...

  6. 各种编程语言的深度学习库整理

    Python 1. Theano是一个python类库,用数组向量来定义和计算数学表达式.它使得在Python环境下编写深度学习算法变得简单.在它基础之上还搭建了许多类库. 1.Keras是一个简洁. ...

  7. 各种编程语言的深度学习库整理(中英版)

    本文总结了Python.Matlab.CPP.Java.JavaScript.Lua.Julia.Lisp.Haskell..NET.R等语言的深度学习库,赶紧收藏吧! Python 1. Thean ...

  8. 涵盖各种编程语言的深度学习库整理大全!

    Python 1. Theano是一个python类库,用数组向量来定义和计算数学表达式.它使得在Python环境下编写深度学习算法变得简单.在它基础之上还搭建了许多类库. 1.Keras是一个简洁. ...

  9. 微软亚马逊联手发布深度学习库Gluon,适合所有段位的炼丹师

    安妮 编译整理 量子位 出品 | 公众号 QbitAI 昨天,亚马逊AWS和微软共同宣布推出深度学习库Gluon.Gluon为各种水平的深度学习开发人员设计,帮助炼丹师们在云端.App和其他设备上设计 ...

最新文章

  1. Nature Methods | 用深度多任务神经网络探索单细胞数据
  2. yii2 请求外部api_微服务架构之「 API网关 」
  3. dqn在训练过程中loss越来越大_DQN算法实现注意事项及排错方法
  4. HNOI2008 GT考试 (KMP + 矩阵乘法)
  5. JLink v8固件丢失修复教程
  6. Anaconda使用pyinstaller打包exe程序体积过大
  7. [LOJ 6485]LJJ 学二项式定理
  8. 网易校招——魔法币问题
  9. AttributeError: ‘str‘ object has no attribute ‘decode‘ model = keras.models.load_model
  10. Vue:打印组件PrintPage
  11. Linux scipy安装
  12. Linux-发送邮件
  13. 用python实现小说的平均句长,词性占比,关键词,标点符号,词形统计
  14. OpenGL三维图形编程技术(转)
  15. linux+qt4.8画波形图,Qt画笔实现波形区域图
  16. java excel 导入 加校验_【JavaWeb】导入Excel并进行校验
  17. 如何推导欧拉公式e^iθ=cosθ+i*sinθ
  18. 实验!实验!还是实验!
  19. 记一次http下载0KB问题的解决
  20. 关于ArcGIS一运行ArcToolbox就闪退问题的两种可能性和解决方案

热门文章

  1. jpa 人大金仓数据库方言_KingBaseV8人大金仓数据库 | 大小写敏感问题
  2. authentication method mysql 8.0查询_mysql 索引整理
  3. mysql 部署在私有云_教你在 RHEL 7 中部署私有云网盘
  4. android如何开发ui服务,Android UI-对Activity工作流程的理解(一)
  5. ssh 连接linux 乱码问题,SSH 连接 Ubuntu 时的中文乱码问题
  6. c# mysql 汉字乱码_在C#和MySQL中存取中文字符时避免乱码的方法
  7. 指定tomcat运行时的JDK版本
  8. VB 去除文本框粘贴功能
  9. 如何批量处理Word中的图片大小
  10. 老黄投下新核弹:英伟达十年力作图灵架构,新GPU支持光线追踪