TPU

TPU, tensor processing unit, 张量处理器, 是Google为机器学习定制的专用芯片(ASIC),专为Google的深度学习框架TensorFlow而设计

TPU 比现在的 CPU、GPU 在深度学习的推断任务上,要快 15~30 倍。而在能耗比上,更是好出 30~80 倍

与图形处理器(GPU)相比,TPU采用低精度(8位)计算,以降低每步操作使用的晶体管数量。降低精度对于深度学习的准确度影响很小,但却可以大幅降低功耗、加快运算速度。同时,TPU使用了脉动阵列的设计,用来优化矩阵乘法与卷积运算,减少I/O操作。此外,TPU还采用了更大的片上内存,以此减少对DRAM的访问,从而更大程度地提升性能。

Google在2016年的Google I/O年会上首次公布了TPU。不过在此之前TPU已在Google内部的一些项目中使用了一年多,如Google街景服务、RankBrain以及其旗下DeepMind公司的围棋软件AlphaGo等都用到了TPU。而在2017年的Google I/O年会上,Google又公布了第二代TPU,并将其部署在Google云平台之上。第二代TPU的浮点运算能力高达每秒180万亿次

使用TPU训练tensorflow

用google colab

直接执行下面代码即可

import tensorflow as tf
import numpy as np
import os(x_train, y_train), (x_test, y_test) = tf.keras.datasets.fashion_mnist.load_data()# add empty color dimension
x_train = np.expand_dims(x_train, -1)
x_test = np.expand_dims(x_test, -1)def create_model():model = tf.keras.models.Sequential()model.add(tf.keras.layers.Conv2D(64, (3, 3), input_shape=x_train.shape[1:]))model.add(tf.keras.layers.MaxPooling2D(pool_size=(2, 2), strides=(2,2)))model.add(tf.keras.layers.Activation('relu'))model.add(tf.keras.layers.Flatten())model.add(tf.keras.layers.Dense(10))model.add(tf.keras.layers.Activation('softmax'))return modeltpu = tf.distribute.cluster_resolver.TPUClusterResolver()
tf.config.experimental_connect_to_cluster(tpu)
tf.tpu.experimental.initialize_tpu_system(tpu)
strategy = tf.distribute.experimental.TPUStrategy(tpu)with strategy.scope():model = create_model()model.compile(optimizer=tf.keras.optimizers.Adam(learning_rate=1e-3),loss=tf.keras.losses.sparse_categorical_crossentropy,metrics=[tf.keras.metrics.sparse_categorical_accuracy])model.fit(x_train.astype(np.float32), y_train.astype(np.float32),epochs=5,steps_per_epoch=60,validation_data=(x_test.astype(np.float32), y_test.astype(np.float32)),validation_freq=5
)

TPU 使用TPU训练tensorflow初探(Colab)相关推荐

  1. 【深度学习】Tensorboard可视化模型训练过程和Colab使用

    [深度学习]Tensorboard可视化模型训练过程和Colab使用 文章目录 1 概述 2 手撸代码实现 3 Colab使用3.1 详细步骤3.2 Demo 4 总结 1 概述 在利用TensorF ...

  2. 用浏览器训练Tensorflow.js模型的18个技巧(上)

    摘要: 送你18个训练Tensorflow.js模型的小技巧! 在移植现有模型(除tensorflow.js)进行物体检测.人脸检测.人脸识别后,我发现一些模型不能以最佳性能发挥.而tensorflo ...

  3. 在英特尔独立显卡上训练TensorFlow模型

    作者:武卓,张晶 目录 1.1 英特尔锐炫™独立显卡简介 1.2 蝰蛇峡谷简介 1.3 搭建训练TensorFlow模型的开发环境 1.3.1 Windows 版本要求: 1.3.2 下载并安装最新的 ...

  4. 谷歌千元级TPU芯片发布,TensorFlow更换Logo推出2.0最新版

    栗子 晓查 发自 凹非寺  量子位 报道 | 公众号 QbitAI 今天凌晨,谷歌一年一度的TensorFlow开发者大会在加州举行.明明应该是一场软件盛会,却被生生开出了硬件发布会的味道. 谷歌在会 ...

  5. DeepR —训练TensorFlow模型进行生产

    Authors Guillaume Genthial, Romain Beaumont, Denis Kuzin, Amine Benhalloum 作家 Guillaume Genthial , R ...

  6. Tensorflow初探之MNIST数据集学习

    官方文档传送门 MNIST数据集是手写数字0~9的数据集,一般被用作机器学习领域的测试,相当于HelloWorld级别. 本程序先从网上导入数据,再利用最小梯度法进行训练使得样本交叉熵最小,最后给出训 ...

  7. pytorch创建模型并训练(初探文本分类问题)

        本博客对pytorch在深度学习上的使用进行了介绍,本博客并不会对怎么训练一个好的模型进行介绍(其实我也不会),我觉得训练一个好的模型首先得选对一个模型(关键的问题在于模型如何设计),然后再经 ...

  8. keras训练完以后怎么预测_还在使用“龟速”的单显卡训练模型?动动手,让TPU节省你的时间...

    点击上方关注,All in AI中国 本文将介绍如何使用Keras和Google CoLaboratory与TPU一起训练LSTM模型,与本地计算机上的GPU相比,这样训练能大大缩短训练时间. 很长一 ...

  9. 1美元从零开始训练Bert,手把手教你优雅地薅谷歌云TPU羊毛

    大数据文摘出品 来源:Google Colab 编译:武帅.曹培信 2018年10月,Google AI团队推出了Bert,可以说Bert一出生就自带光环. 在斯坦福大学机器阅读理解水平测试SQuAD ...

  10. bert 中文 代码 谷歌_1美元从零开始训练Bert,手把手教你优雅地薅谷歌云TPU羊毛...

    大数据文摘出品 来源:Google Colab 编译:武帅.曹培信 2018年10月,Google AI团队推出了Bert,可以说Bert一出生就自带光环. 在斯坦福大学机器阅读理解水平测试SQuAD ...

最新文章

  1. torch.tensordot()介绍
  2. 《深入理解ES6》笔记——Set集合与Map集合(7)
  3. QTP的那些事--调用外部的文件的方法
  4. Java提升篇-事务隔离级别和传播机制
  5. Gartner:企业机构需重新定义网络安全领导者角色
  6. PostgreSQL 10.1 手册_部分 III. 服务器管理_第 26 章 高可用、负载均衡和复制_26.4. 日志传送的替代方法...
  7. 实训以来,到这里的次数少了!
  8. 培训loadrunner感受
  9. 【时间序列】DTW算法详解
  10. 误差平方和用python,残差平方和sklearn.linear_模型线性回归
  11. Hello, CTF WP
  12. 零基础语法入门三十一讲[被动语态 (1)]被动语态的构成和含义
  13. 我想给我的公众号改个名,好不好嘞
  14. 关于iPhone删除无法删除的描述文件
  15. Nvidia显卡驱动下载
  16. vscode离线下载对应版本的插件,避免版本兼容问题
  17. RBAC数据库的E-R模型
  18. Linux C高阶(14)C语言宏定义你所不知道的事
  19. 小米手机关闭自带服务器,米聊2月19号关闭服务器,曾是小米的三驾马车之一。...
  20. ibm服务器显示f1至f12,ThinkPad 系列机型如何将F1~F12设定默认

热门文章

  1. 北京16个山水美景| 清明小长假走起吧!
  2. 请问,“什么知识才是值得学习的?”
  3. 特殊符号(包括数字和字母)
  4. 红月OD反汇编实时显示坐标,背景色可透明也可以不透明
  5. 2017年中级会计师考试(0910日)(回忆版)
  6. 台式计算机开不了机,台式电脑开不了机
  7. 基于FPGA的实时图像边缘检测系统设计(下)
  8. 中国PET瓶坯注塑系统行业应用态势与投资前景预测报告(2022-2028年)
  9. Learning optical flow from still images
  10. python绘制彩色地震剖面断层解释_地震剖面上断层的识别标志主要有哪些