AI科技大本营消息,北京时间周一(2月12日)晚间,Google 宣布,在 Google Cloud Platform(GCP)上正式推出Cloud TPUs 测试版服务,帮助研究人员更快地训练和运行机器学习模型 。目前的收费标准为 6.5 美元/Cloud TPU/小时,而且供应有限,需要提前申请。

TPU(Tensor Processing Unit)的全名为张量处理单元 ,是 Google 专为机器学习而定制的一款芯片。在去年 5 月 18 日的Google I/O 大会上,Google 正式推出第二代 TPU —— Cloud TPU,相比第一代,第二代对推理和训练都进行了优化。

然而,Google 的 TPU 一直只在内部使用,此次 Google 首次对外全面开放自家的 TPU,这或许意味着谷歌正式向英伟达的 GPU 开炮,加速 TPU 的商业化进程,在 AI 基础设施领域抢占地盘。

以下是 Google Cloud 的官方博客内容:

Cloud TPUs 是 Google 设计的一系列硬件加速器,专门针对加速和扩大使用 TensorFlow 编程的机器学习工作负载进行了优化。每个 Cloud TPU 由四个定制的 ASIC 构成,单个 Cloud TPU 的浮点计算能力可以达到 180 teraflops(万亿次每秒),内存宽带 64GB。

这些板卡可以单独使用,也可以通过超快的专用网络连接在一起,共同构建成 multi-petaflop(几千万亿次每秒) 的机器学习超级计算机,我们称之为“TPU pods”。今年晚些时候,我们将在 GCP 上提供这些大型的“超级计算机”。

我们设计 Cloud TPUs 的目的是为了给 TensorFlow 工作负载提供差异化的性能,让机器学习工程师和研究人员能够更快地迭代(机器学习模型)。比如:

  • 从此以后,你不用再等待共享计算机集群的调度,只需通过可以控制并自定义的 Google 计算引擎虚拟机,就可以独占联网的 Cloud TPU。
  • 以前训练商用机器学习模型可能要等上几天甚至几周,现在只需要一个晚上,你就可以在 Cloud TPUs 机群上训练出统一模型的不同变体,第二天就可以将准确率最高的训练模型部署到生产活动中去。
  • 使用单个 Cloud TPU,并遵循该教程(https://cloud.google.com/tpu/docs/tutorials/resnet),你就可以在不到一天的时间内训练出符合你期望的 ResNet-50 网络,使其在 ImageNet 基准挑战上达到你所期望的准确率,而且花费不超过 200 美元。

▌让机器学习模型训练更容易

传统上,为定制的 ASIC 和超级计算机编写程序需要深入的专业知识,但是对于 Cloud TPU 而言,你可以使用高级的 TensorFlow APIs 进行编程。我们开源了一系列高性能 Cloud TPU 模型实现,帮助你快速上手:

  • ResNet-50,其他常用的图像分类模型。
  • 用于机器翻译和语言建模的 Transformer
  • 用于目标检测的 RetinaNet

为了节约你的时间和精力,我们将持续测试这些模型实现在标准数据集上的性能和收敛至期望准确率的情况。

之后,我们还将开源更多的模型实现。热爱探索的机器学习专家可以使用我们提供的文档(https://cloud.google.com/tpu/docs/)和工具(https://cloud.google.com/tpu/docs/cloud-tpu-tools),优化其他在 Cloud TPUs 运行的 TensorFlow 模型。

如果你现在就开始使用 Cloud TPU,那么在今年晚些时候我们推出 TPU pod 时,你将会从训练时间到准确率的大幅提升中收益。正如我们在 NIPS 2017 上宣布的那样,在一个完整的 TPU pod 上,ResNet-50 和 Transformer 的训练时间将从大半天将至 30 分钟以内,而且无需修改任何代码。

▌可扩展的机器学习平台

Cloud TPU 同样简化了机器学习计算资源的规划和管理过程:

你可以为自己的团队提供顶尖的机器学习加速,并且根据需求的变化动态调整自己的容量;

  • 相比于花费时间和金钱,并聘请专业的人才来设计、安装、维护一个需要专门的功能、冷却、网络和存储设备的实体机器学习计算集群,你可以从 Google 持续多年专门优化过的大规模、高集成的机器学习基础设施中受益。
  • 不需要费力地保证各种工作站和服务器的驱动更新升级,因为 Cloud TPU 根本不要安装驱动。
  • Google Cloud 将提供同样复杂的安全机制和实践保护。

除了 Cloud TPUs,Google Cloud 也会提供一系列的高性能 CPU(包括英特尔 Skylake)和 GPU (包括英伟达 Tesla V100)。

目前,Cloud TPU 的供应依然受限,申请地址为:https://services.google.com/fb/forms/cloud-tpu-beta-request/。价格将以秒计费,大约为 6.5 美元/Cloud TPU/小时。

终于能用Google的TPU跑代码了,每小时6.5美元相关推荐

  1. 深度学习怎么跑代码?

    深度学习怎么跑代码?从事深度学习的研究者都知道,深度学习代码需要设计海量的数据,需要很大很大很大的计算量,以至于CPU算不过来,需要通过GPU帮忙,今天怎么教大家免费使用GPU跑深度学习代码. 深度学 ...

  2. 微软CEO:别被Google的TPU诱惑,Kinect“复活” | Build 2018

    夏乙 允中 假装发自 西雅图 量子位 出品 | 公众号 QbitAI  微软Build 2018大会今天午夜在大洋彼岸开幕. 大会首日,微软集中火力大谈人工智能.云计算.物联网.AR等技术.在今天 ...

  3. 如何在实验室服务器上跑代码

    1.工具准备 可以下载一个xshell或secureCRT或者其他shell工具,通过ssh方式连接服务器,然后通过本地电脑终端控制服务器.连接方式输入主机(Host),和端口号(一般是22)就行了. ...

  4. 假期离校必备:Mac远程连接Win10桌面(设置断电自动重启、Win10配置远程桌面、Microsoft Remote Desktop Beta远程桌面连接、将Win作为服务器可以conda跑代码)

    假期离校必备:Mac远程连接Win10桌面(设置断电自动重启.Win10配置远程桌面.Microsoft Remote Desktop Beta远程桌面连接.将Win作为服务器可以conda跑代码) ...

  5. imacros自动跑代码_如何使用iMacros自动执行重复的Web浏览器任务

    imacros自动跑代码 Computers are supposed to automate repetitive tasks – if you find yourself submitting f ...

  6. 研一小白记录第一次在实验室服务器上跑深度学习的代码全过程(实验室服务器上跑代码详细全过程哦)

    你在服务器上跑过代码吗?哇~你跑过!是啥样的...每回见别人跑都会问并且羡慕会在大服务器上跑代码的哈哈哈在研究生刚开学前还甚至不知道什么是服务器,更是无法想象在除了自己能看得见摸得着的电脑屏幕之外跑代 ...

  7. 基于Google Edge TPU的Coral USB加速棒体验

    本博客转自:爱板网 还记得2018年谷歌发布的那个震撼全球的Edge TPU吗?现在基于Edge TPU的两款设备已经正式发售,爱板网第一时间带大家来感受下实际体验效果. Coral USB加速棒 曾 ...

  8. vscode上利用screen命令跑代码

    screen命令跑代码 1.创建窗口并激活虚拟环境 2.退出窗口/进入窗口 3.好处 1.创建窗口并激活虚拟环境 在命令行输入: screen -S train 右上角,可以看到已经进入screen创 ...

  9. Pycharm远程连接服务器来跑代码

    目录 一.进入pycharm 二.步骤 1.开始 2.接下来输入你的密码 3.选择所需要的虚拟环境 4.完成一半啦 5.完成 一.进入pycharm 二.步骤 1.开始 点击pycharm左上角的fi ...

最新文章

  1. LOJ#2302 整数
  2. 2015/12/28 十六进制转八进制 八进制转十六进制 作业
  3. P1525 关押罪犯
  4. python基础学习[python编程从入门到实践读书笔记(连载四)]:数据可视化项目第15章
  5. 理论修炼之ETCD,高一致性Key-Value服务提供者中的佼佼者
  6. 一个有趣的问题, 你知道SqlDataAdapter中的Fill是怎么实现的吗
  7. leetcode题解——贪心
  8. 如何在C#中使用全局鼠标、键盘Hook
  9. Java中File操作
  10. 提前祝各位:圣诞节快乐~
  11. ping,python实现批量ping包工具--小案例v4优化版本
  12. QT学习资料博客:《Qt 实战一二三》和《Qt 学习之路 2》等
  13. 高层建筑电气设计说明书
  14. gps高斯utm_高斯投影与UTM投影的区别
  15. 产品需求文档模板,不用找了(附“简”例)【转】
  16. 月活8.89亿背后:微信工程师细数兼容测试经验
  17. [zz]u盘做系统启动盘后容量变小的解决方法 8GU盘变成2G 或 xG变成2G
  18. 分享免费的主流电商平台商品图片批量下载方法
  19. 常见Linux命令pwd实现
  20. python调用短信宝API发送短信(附python代码 易理解)

热门文章

  1. sql server日志占用空间过大的问题
  2. 如何解决在数据显示的时候,页面出现null的情况
  3. 自动驾驶软件工程之局部规划
  4. 动态规划——最长上升子序列问题 两种角度及优化算法
  5. 2018.09.01 poj3071Football(概率dp+二进制找规律)
  6. 第二章、IP协议详解
  7. ORA-01747: user.table.column, table.column 或列说明无效 异常解决方法总结
  8. [BZOJ2502]清理雪道 有上下界网络流(最小流)
  9. Delphi实现WebService带身份认证的数据传输
  10. 数据结构与算法:17 图