笔记源于一次微课堂,由数据人网主办,英伟达高级工程师ParallerR原创。大牛的博客链接:http://www.parallelr.com/training/

由于本人白痴,不能全部听懂,所以只能把自己听到的写个小笔记。

一、GPU的基本概念

GPU计算比CPU计算要快很多,计算机用GPU会大大加大速度

问题:现在不是有量子计算,GPU与其有什么区别?那么量子计算是否比GPU更能是明日之星呢?

CPU 中ALU只有四个,虽然大,但是control与cache占比较大;而GPU又很多,虽然小,但是control,cache占比小,所以更有优势,有长尾效应。用非常大量的小单元来加快运行速度。

GPU模式

CPU做逻辑运算时,比较好,但是当遇见特别密集型、单一的计算网格时,就会使用GPU进行计算。所以GPU与CPU是相互配合进行计算。

GPGPU使用方法(GPU本来是处理图像的,现在GPU升级,可以处理一些计算)


1、已有的GPU库,我们直接调用API,最容易最简单,因为我们不需要知道GPU的使用内容,缺点:但是需要开发者,很清晰了解算法本身,知道哪些可以用GPU进行计算,哪些不用,不然会很乱。

2、编译器,通过一些方法把我们的算法自动GPU化,然后跑到程序里面去;

3、算法完全用GPU重写,成本最高,但是这个算法能够很效率。CUDA

二、GPU计算应用到R语言之中

R速度慢,是解释性语言,一条命令,先编译成指令,然后传输到CPU进行计算;

编译性语言可以直接访问CPU等,

内存不够,先读入R内存,然后再进行计算,对于R的存储有要求。

R与GPU结合

一般有GPU package,一般有三种方法:library、cuda

Cuda的库,可用性很强,

两个例子:

BLAS、FFT包

1、blas包

矩阵计算,需要R先预编译,下面的网址有编译的手法。只能在linux下运行。

http://www.parallelr.com/r-hpac-benchmark-analysis/

2、FFT

https://devblogs.nvidia.com/parallelforall/accelerate-r-applications-cuda/

调用已有GPU的库,中高级使用者;遇到性能问题的可以选

要写interface function

学习笔记︱深度学习以及R中并行算法的应用(GPU)相关推荐

  1. 学习笔记--深度学习入门--基于Pyrhon的理论与实现--[日]斋藤康毅 -- 持续更新中

    关于这本 "神作" 的简介 这本书上市不到 2 年,就已经印刷 10 万册了.日本人口数量不大,但是却有这么多人读过这本书,况且它不是一本写真集,是实实在在的技术书,让人觉得很不可 ...

  2. 人工智障学习笔记——深度学习(2)卷积神经网络

    上一章最后提到了多层神经网络(deep neural network,DNN),也叫多层感知机(Multi-Layer perceptron,MLP). 当下流行的DNN主要分为应对具有空间性分布数据 ...

  3. 人工智障学习笔记——深度学习(4)生成对抗网络

    概念 生成对抗网络(GAN)是一种深度学习模型,是近年来复杂分布上无监督学习最具前景的方法之一.模型通过框架中(至少)两个模块:生成模型(Generative Model)和判别模型(Discrimi ...

  4. 人工智障学习笔记——深度学习(1)神经网络

    一.神经网络 我们所说的深度学习,其最基础最底层的模型称之为"神经网络"(neural network),因为我们希望机器能够像我们人类大脑的神经网络处理事件一样去解决问题,最终达 ...

  5. Matlab深度学习笔记——深度学习工具箱说明

    本文是Rasmus Berg Palm发布在Github上的Deep-learning toolbox的说明文件,作者对这个工具箱进行了详细的介绍(原文链接:https://github.com/ra ...

  6. 3Blue1Brown深度学习笔记 深度学习之神经网络的结构 Part 1 ver 2.0

    神经元 3B1B先讨论最简单的MLP(多层感知器),只是经典的原版,就已经能识别手写数字. 这里一开始我们把神经元看作装有数字的容器,装着一个0~1之间的数字.但是最后更准确一些,我们把神经元看作一个 ...

  7. 人工智障学习笔记——深度学习(3)递归神经网络

    传统的神经网络模型中,输入层到隐含层再到输出层他们的层与层之间是全连接的,但是每层之间的节点是无连接的.这样就会造成一个问题,有些情况,每层之间的节点可能是存在某些影响因素的.例如,你要预测句子的下一 ...

  8. 系列笔记 | 深度学习连载(6):卷积神经网络基础

    点击上方"AI有道",选择"星标"公众号 重磅干货,第一时间送达 卷积神经网络其实早在80年代,就被神经网络泰斗Lecun 提出[LeNet-5, LeCun ...

  9. 系列笔记 | 深度学习连载(5):优化技巧(下)

    点击上方"AI有道",选择"星标"公众号 重磅干货,第一时间送达 深度学习中我们总结出 5 大技巧: 本节继续从第三个开始讲起. 3. Early stoppi ...

最新文章

  1. Java 日志框架适配/冲突解决方案(值得收藏)
  2. (最新最全)windows使用anaconda安装pytorch进行深度学习并使用GPU加速
  3. 为什么那么多人工作都不开心?
  4. linux 易语言窗口程序_浅谈Linux入门的基本知识
  5. 个人c++ 错误记录
  6. 用Jfree实现条形柱状图表,java代码实现
  7. Tensorflow 对抗生成网络GAN 不服就GAN
  8. js 返回上一页面_pdf.js实战,含水印、电子签章解决方案
  9. RV1109 Linux SDK入门指南
  10. adb修改什么文件获取root权限_Android获取ROOT权限的通用方法
  11. VJ 1490 小菜的数码验证
  12. 开源的调查问卷平台LimeSurvey
  13. 在做开关电路时,三极管限流电阻该如何选择?
  14. 驾驭synchronize的方法
  15. ps和计算机一样吗,ps分辨率和电脑显示不一样怎么办
  16. 华为android打开usb调试模式,华为 PE-CL00 开启USB调试模式
  17. 作业1.1利用Audacity软件分析音频
  18. 什么是数据湖?为什么需要数据湖?
  19. Mac中安装软件的传送门
  20. TensorFlow报错:AttributeError: module 'tensorflow._api.v1.train' has no attribute 'SummaryWriter'等

热门文章

  1. A - 还是畅通工程(最小生成树)
  2. objective-C 2.0
  3. ANDROID模拟器访问本地WEB应用10.0.2.2
  4. 在磁盘上给文件快速预留一大片空间
  5. DataGridView用法总结
  6. ASP.NET MVC - 用户验证和权限验证
  7. 针对ASP.NET页面实时进行GZIP压缩优化的几款压缩模块的使用简介及应用测试!(附源码)...
  8. songEagle开发系列:如何让文章实时保存的问题
  9. Python可视化库Matplotlib的使用
  10. 采用HTML5之“data