文章目录

  • 前言
  • 一、导入环境
  • 二、定义函数
  • 三、测试

前言

这里运用一个自定义大小的矩阵数据计算,来测试gpu与cpu运算时间的对比。


以下为实现方法

一、导入环境

示例:pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。

#设置显卡内存使用率,根据使用率占用
import os
os.environ["TF_FORCE_GPU_ALLOW_GROWTH"] = "true"
import tensorflow as tf
print('Tensorflow:{}'.format(tf.__version__))
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline
import timeit as timeit

二、定义函数

#创建在cpu环境上运算的两个矩阵
n=100
with tf.device('/cpu:0'):cpu_a = tf.random.normal([1,n])cpu_b = tf.random.normal([n,1])print(cpu_a.device,cpu_b.device)#创建在gpu环境上运算的两个矩阵
with tf.device('/gpu:0'):gpu_a = tf.random.normal([1,n])gpu_b = tf.random.normal([n,1])print(gpu_a.device,gpu_b.device)def cpu_run(): #cpu运算时间with tf.device('/cpu:0'):c = tf.matmul(cpu_a,cpu_b)return c
def gpu_run(): #cpu运算时间with tf.device('/gpu:0'):c = tf.matmul(gpu_a,gpu_b)return c

三、测试

# 第一次计算需要热身,避免将初始化时间结算在内
cpu_time = timeit.timeit(cpu_run,number=10)
gpu_time = timeit.timeit(gpu_run,number=10)
print('warmup:',cpu_time,gpu_time)#正式计算十次,取平均时间
cpu_time = timeit.timeit(cpu_run,number=10)
gpu_time = timeit.timeit(gpu_run,number=10)
print('run_time:',cpu_time,gpu_time)

tensorflow2.0的cpu与gpu运行时间对比相关推荐

  1. 转载:CPU, DSP, GPU, FPGA对比

    学习于Qiuoooooo CPU 一般来说CPU运算能力最弱,CPU虽然主频最高,但是单颗也就8核.16核的样子,一个核3.5g,16核也就56g,再考虑指令周期,每秒最多也就30g次乘法.还是定点的 ...

  2. CPU, DSP, GPU, FPGA对比

    1. CPU 一般来说CPU运算能力最弱,CPU虽然主频最高,但是单颗也就8核.16核的样子,一个核3.5g,16核也就56g,再考虑指令周期,每秒最多也就30g次乘法.还是定点的. 2. DSP D ...

  3. Anaconda3安装tensorflow 2.0版本cpu和gpu安装,Win10系统

    tensorflow是在anaconda上安装的,所以先安装anconda 一.安装anaconda3 我安装的是这一个,anaconda自带python,所以不需要单独安装python 点击安装,一 ...

  4. 0921深度学习硬件CPU和GPU

    计算机 构成 CPU(处理器):除了运行操作系统和其他许多功能外,还能执行程序:通常由 8 个或者更多个核心组成 内存(随机访问存储,RAM):用于存储和检索计算结果,如权重向量和激活参数,以及训练数 ...

  5. 【动手学深度学习PyTorch版】23 深度学习硬件CPU 和 GPU

    上一篇请移步[动手学深度学习PyTorch版]22续 ResNet为什么能训练出1000层的模型_水w的博客-CSDN博客 目录 一.深度学习硬件CPU 和 GPU 1.1 深度学习硬件 ◼ 计算机构 ...

  6. CPU和GPU的物理结构,性能和应用场景比较

    1. 写了啥 CPU和GPU作为电子计算机的重要部件,在近年来受到工业界的广泛关注,正处于高速迭代的发展期.发展到今日,CPU与GPU同作为计算部件,在应用场景上已经出现明显的区别,与之对应的,二者在 ...

  7. Tensorflow2.0安装教程(windows系统,CPU和GPU版本)

    文章目录 一.Anaconda安装 二.tensorflow2.0安装 2.1 创建Anaconda环境 2.2 进入TF20环境 2.3 Tensorflow安装 三.验证tensorflow安装成 ...

  8. TensorFlow2.0选择GPU或CPU训练

    注意:以下所有程序都要在导入TensorFlow和keras包之前加入才可以 选择CPU: import os os.environ["CUDA_DEVICE_ORDER"] = ...

  9. tensorflow的CPU版和GPU版本对比

    最近深度学习CPU根本不够用,老板配置了GPU 怎么能不会用呢? 原来从来没有关注过的底层东西,于是乎痛下决心搞清楚原理和操作 先来看看第一部分 为什么GPU比CPU更diao呢? 这里就需要从他么的 ...

最新文章

  1. Android精通:View与ViewGroup,LinearLayout线性布局,RelativeLayout相对布局,ListView列表组件...
  2. Hive常用的SQL命令操作
  3. 分库、分表、分区的区别,傻傻分不清?
  4. SAP ABAP程序效率优化 Perfomance Tune
  5. HTTP缓存及其使用
  6. Asp.Net验证控件和表达式测试题
  7. java 运行 出现选择_Eclipse 运行出现java.lang.NoClassDefFoundError的解决方法
  8. java停止循环label_Java中的break Label 和continue Label 例子(跳出多重循环)(转)...
  9. 个性化新闻文章推荐的上下文Bandit方法
  10. mysql主从架构图_MySQL主从架构
  11. php网页背景音乐代码,HTML5背景音乐播放器代码
  12. C盘清理--模拟器(夜神为例)占用空间越来越大问题解决方案(本方法适用于安装过多个APK,虽然卸载了但是占用仍然很严重的情况)
  13. banner图的开发
  14. Real-Time Rendering Chapter 1~6 读书笔记
  15. 李彦宏登上《时代》封面:他正帮中国在21世纪赢得胜利
  16. 粉笔公考——常识专项课——民法典
  17. 2014儒豹浏览器的前行之路
  18. (NLP)文本预处理
  19. 社团管理系统软件测试,软件测试大作业——社团管理系统(19页)-原创力文档...
  20. N4中Obix服务端

热门文章

  1. Leetcode1963. 使字符串平衡的最小交换次数[C++题解]:贪心
  2. 《算法竞赛进阶指南》打卡-基本算法-AcWing 97. 约数之和:递归、快速幂
  3. c语言编程中句柄无效怎么解决,句柄无效,手把手教你句柄无效怎么解决
  4. java推送技术_java网络编程 - java服务器推送技术系列方案实战
  5. 苹果11怎么关掉横屏_苹果手机这些常规操作你可能不会!教你省电又省心?
  6. SNMP功能开发简介 五 使用MIB Builder创建MIB文件图文介绍
  7. android 日期弹出框,Android 日期选择框 简洁常用
  8. python能表示多大整数_Python无法表示99999999999999999999这样大的整数。
  9. win10电脑插耳机没声音_Win10如何录制电脑内部播放的声音
  10. 新建文件夹html文件,JS实现新建文件夹功能