tensorflow2.0的cpu与gpu运行时间对比
文章目录
- 前言
- 一、导入环境
- 二、定义函数
- 三、测试
前言
这里运用一个自定义大小的矩阵数据计算,来测试gpu与cpu运算时间的对比。
以下为实现方法
一、导入环境
示例:pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。
#设置显卡内存使用率,根据使用率占用
import os
os.environ["TF_FORCE_GPU_ALLOW_GROWTH"] = "true"
import tensorflow as tf
print('Tensorflow:{}'.format(tf.__version__))
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline
import timeit as timeit
二、定义函数
#创建在cpu环境上运算的两个矩阵
n=100
with tf.device('/cpu:0'):cpu_a = tf.random.normal([1,n])cpu_b = tf.random.normal([n,1])print(cpu_a.device,cpu_b.device)#创建在gpu环境上运算的两个矩阵
with tf.device('/gpu:0'):gpu_a = tf.random.normal([1,n])gpu_b = tf.random.normal([n,1])print(gpu_a.device,gpu_b.device)def cpu_run(): #cpu运算时间with tf.device('/cpu:0'):c = tf.matmul(cpu_a,cpu_b)return c
def gpu_run(): #cpu运算时间with tf.device('/gpu:0'):c = tf.matmul(gpu_a,gpu_b)return c
三、测试
# 第一次计算需要热身,避免将初始化时间结算在内
cpu_time = timeit.timeit(cpu_run,number=10)
gpu_time = timeit.timeit(gpu_run,number=10)
print('warmup:',cpu_time,gpu_time)#正式计算十次,取平均时间
cpu_time = timeit.timeit(cpu_run,number=10)
gpu_time = timeit.timeit(gpu_run,number=10)
print('run_time:',cpu_time,gpu_time)
tensorflow2.0的cpu与gpu运行时间对比相关推荐
- 转载:CPU, DSP, GPU, FPGA对比
学习于Qiuoooooo CPU 一般来说CPU运算能力最弱,CPU虽然主频最高,但是单颗也就8核.16核的样子,一个核3.5g,16核也就56g,再考虑指令周期,每秒最多也就30g次乘法.还是定点的 ...
- CPU, DSP, GPU, FPGA对比
1. CPU 一般来说CPU运算能力最弱,CPU虽然主频最高,但是单颗也就8核.16核的样子,一个核3.5g,16核也就56g,再考虑指令周期,每秒最多也就30g次乘法.还是定点的. 2. DSP D ...
- Anaconda3安装tensorflow 2.0版本cpu和gpu安装,Win10系统
tensorflow是在anaconda上安装的,所以先安装anconda 一.安装anaconda3 我安装的是这一个,anaconda自带python,所以不需要单独安装python 点击安装,一 ...
- 0921深度学习硬件CPU和GPU
计算机 构成 CPU(处理器):除了运行操作系统和其他许多功能外,还能执行程序:通常由 8 个或者更多个核心组成 内存(随机访问存储,RAM):用于存储和检索计算结果,如权重向量和激活参数,以及训练数 ...
- 【动手学深度学习PyTorch版】23 深度学习硬件CPU 和 GPU
上一篇请移步[动手学深度学习PyTorch版]22续 ResNet为什么能训练出1000层的模型_水w的博客-CSDN博客 目录 一.深度学习硬件CPU 和 GPU 1.1 深度学习硬件 ◼ 计算机构 ...
- CPU和GPU的物理结构,性能和应用场景比较
1. 写了啥 CPU和GPU作为电子计算机的重要部件,在近年来受到工业界的广泛关注,正处于高速迭代的发展期.发展到今日,CPU与GPU同作为计算部件,在应用场景上已经出现明显的区别,与之对应的,二者在 ...
- Tensorflow2.0安装教程(windows系统,CPU和GPU版本)
文章目录 一.Anaconda安装 二.tensorflow2.0安装 2.1 创建Anaconda环境 2.2 进入TF20环境 2.3 Tensorflow安装 三.验证tensorflow安装成 ...
- TensorFlow2.0选择GPU或CPU训练
注意:以下所有程序都要在导入TensorFlow和keras包之前加入才可以 选择CPU: import os os.environ["CUDA_DEVICE_ORDER"] = ...
- tensorflow的CPU版和GPU版本对比
最近深度学习CPU根本不够用,老板配置了GPU 怎么能不会用呢? 原来从来没有关注过的底层东西,于是乎痛下决心搞清楚原理和操作 先来看看第一部分 为什么GPU比CPU更diao呢? 这里就需要从他么的 ...
最新文章
- Android精通:View与ViewGroup,LinearLayout线性布局,RelativeLayout相对布局,ListView列表组件...
- Hive常用的SQL命令操作
- 分库、分表、分区的区别,傻傻分不清?
- SAP ABAP程序效率优化 Perfomance Tune
- HTTP缓存及其使用
- Asp.Net验证控件和表达式测试题
- java 运行 出现选择_Eclipse 运行出现java.lang.NoClassDefFoundError的解决方法
- java停止循环label_Java中的break Label 和continue Label 例子(跳出多重循环)(转)...
- 个性化新闻文章推荐的上下文Bandit方法
- mysql主从架构图_MySQL主从架构
- php网页背景音乐代码,HTML5背景音乐播放器代码
- C盘清理--模拟器(夜神为例)占用空间越来越大问题解决方案(本方法适用于安装过多个APK,虽然卸载了但是占用仍然很严重的情况)
- banner图的开发
- Real-Time Rendering Chapter 1~6 读书笔记
- 李彦宏登上《时代》封面:他正帮中国在21世纪赢得胜利
- 粉笔公考——常识专项课——民法典
- 2014儒豹浏览器的前行之路
- (NLP)文本预处理
- 社团管理系统软件测试,软件测试大作业——社团管理系统(19页)-原创力文档...
- N4中Obix服务端
热门文章
- Leetcode1963. 使字符串平衡的最小交换次数[C++题解]:贪心
- 《算法竞赛进阶指南》打卡-基本算法-AcWing 97. 约数之和:递归、快速幂
- c语言编程中句柄无效怎么解决,句柄无效,手把手教你句柄无效怎么解决
- java推送技术_java网络编程 - java服务器推送技术系列方案实战
- 苹果11怎么关掉横屏_苹果手机这些常规操作你可能不会!教你省电又省心?
- SNMP功能开发简介 五 使用MIB Builder创建MIB文件图文介绍
- android 日期弹出框,Android 日期选择框 简洁常用
- python能表示多大整数_Python无法表示99999999999999999999这样大的整数。
- win10电脑插耳机没声音_Win10如何录制电脑内部播放的声音
- 新建文件夹html文件,JS实现新建文件夹功能