谷歌让AI芯片学会“下崽”,下一代TPU就让AI自己设计
月石一 发自 凹非寺
量子位 报道 | 公众号 QbitAI
设计一块AI芯片有多难?
这么说吧,围棋的复杂度10360,而芯片则是102500,你感受一下……
△围棋的复杂度
一般来说,工程师们设计一块芯片,少则需要几周,多则好几个月。
现在,AI生产力来了!
AI自己动手,竟然用6小时就设计出一块芯片。
最近,这项谷歌的研究登上了Nature杂志。
布局时间缩短数倍
小小的一块芯片包括了数十亿个晶体管,由它们组成的数千万个逻辑门就是标准单元,此外还有数千个存储块,称为宏块。
确定它们的位置,也就是布局规划,对芯片设计至关重要。
因为这直接关系到如何布线,进而影响着芯片的处理速度和电源效率。
但是,光是放置宏块这一步就非常耗时,为了给标准单元留出更多空间,每一次迭代都需要几天或几周时间。
△人类设计和AI设计芯片的平面图(灰色块为宏块)
完成整个布局,则要花费数周甚至数月。
现在,谷歌的研究人员提出了一种具有泛化能力的芯片布局方法。
它能够基于深度强化学习,从之前的布局中进行学习,然后生成新的设计方案。整体架构是这样的:
由于AI模型需要学习10万个芯片布局,为了保证速度,研究人员设计了一种奖励机制,基于线路长度和布线拥塞的近似代价函数进行计算。
具体来说,需要将宏和标准单元映射到一个平面画布上,形成具有数百万到数十亿节点的「芯片网表」。
然后,AI模型会对功率、性能和面积(PPA) 等进行优化,并且输出概率分布。
下图分别是零样本生成和基于预训练策略微调的效果,其中每个小矩形代表一个宏块。在预训练策略中,中间留出了用于放置标准单元的空间。
与其他方法相比,谷歌的新方法大大减少了设计时间,只需不到6小时,就能实现性能优化的布局。
谷歌:效果不错,已经用上了
研究团队对不同策略下的布局效果进行了可视化展示,从图中可以看到,预训练策略微调的结果要明显优于零样本生成。
并且,从不同训练时长的效果对比可以看到,在训练2-12小时的情况下,预训练策略要优于零样本生成。
在不同规模的数据集上进行测试,研究人员发现,随着数据集规模的扩大,生成布局的质量和收敛时间的结果更优。
谷歌表示,
这一方法适用于任何类型的芯片。
目前已经被用于生产下一代Google TPU(加速器芯片)。
参考链接:
https://www.nature.com/articles/s41586-021-03544-w
https://www.nature.com/articles/d41586-021-01515-9
https://ai.googleblog.com/2020/04/chip-design-with-deep-reinforcement.html
https://arxiv.org/abs/2004.10746
谷歌让AI芯片学会“下崽”,下一代TPU就让AI自己设计相关推荐
- ai算子是什么_肇观电子刷新端侧AI芯片性能记录并发布“5分钟部署”AI开发平台 - 企业资讯...
基于多年研发的CVKit™ NN IP的N1系列SoC芯片刷新了端侧AI芯片性能记录.领先的每TOPs处理帧数,实时数据流处理能力,支持高精度FP16神经网络模型直接无损部署,高性能的INT8网络支持 ...
- 存算一体 – 智能驾驶AI芯片的下一个战场
交流群 | 进"滑板底盘群"请加微信号:xsh041388 交流群 | 进"域控制器群"请加微信号:ckc1087 备注信息:滑板底盘/域控制器+真实姓名.公司 ...
- 一文看懂谷歌的AI芯片布局,边缘端TPU将大发神威
来源:新电子 2018年7月Google在其云端服务年会Google Cloud Next上正式发表其边缘(Edge)技术,与另两家国际公有云服务大厂Amazon/AWS.Microsoft Azur ...
- 为什么 AI 芯片时代必然到来——从TPU开始的几十倍性能之旅
作者:刘肉酱 摩尔定律的终结将使服务于特定领域的架构成为计算的未来.一个开创性的例子就是谷歌在 2015 年推出的张量处理单元(TPU),目前已经在为超过十亿人提供服务.TPU 使深度神经网络(DNN ...
- 巴比特 | 元宇宙每日必读:科技巨头们下场自研AI芯片,微软、谷歌、亚马逊已推出或计划发布8款服务器和AI芯片,Meta也在路上...
摘要:据澎湃新闻报道,当下,英伟达还是当之无愧的"AI算力王者",A100.H100系列芯片占据金字塔顶尖位置,是ChatGPT这样的大型语言模型背后的动力来源.然而,不管是为了降 ...
- 荣耀发布V10搭载AI芯片 人工智能是下一波手机革命
11月28日荣耀手机发布会在北京举办,荣耀V10正式亮相.搭载EMUI8.0系统,配备3750毫安电池,支持快充和车载快充.一体化金属机身,内屏圆角保证视觉简洁,另外还保留了3.5mm耳机孔.机身颜色 ...
- 清华发布《AI芯片技术白皮书》:新计算范式,挑战冯诺依曼、CMOS瓶颈
来源:机器人 悦智网 摘要:在由北京未来芯片技术高精尖创新中心和清华大学微电子学研究所联合主办的第三届未来芯片论坛上,清华大学正式发布了<人工智能芯片技术白皮书(2018)>. <白 ...
- AI芯片,为何现在成为新军备竞赛?
雷刚 发自 凹非寺 量子位 报道 | 公众号 QbitAI 一场新的军备竞赛已经打响,不在地面,不在空中,它将是虚拟网络世界新一代基石,也是AI时代连接虚拟和现实的核心. 没错,AI芯片,正在引发一 ...
- “AI芯片”通识_AI产品经理看这一篇就够了_团员分享_@书博
前言:本文作者团员@书博 ,从事过芯片.硬件.嵌入式等相关工作,最近希望成为"AI芯片"领域的产品经理,所以专门深度研究这个领域,输出了这篇文章.本文,是用产品经理能够看得懂的语言 ...
最新文章
- 2021最新版 SpringBoot 速记教程
- linux mysql5.7.11安装_Linux下安装MySQL 5.7.11
- 10、kubernetes 核心技术-Secret、ConfigMap
- MVC之前的那点事儿系列(2):HttpRuntime详解分析(上)
- proc_open 命令包含“有小问题
- Spring-AOP @AspectJ进阶之命名切点
- TF之LSTM:基于tensorflow框架自定义LSTM算法实现股票历史(1990~2015数据集,6112预测后100+单变量最高)行情回归预测
- java 远程查看电脑磁盘,请问你如何在Java中监视计算机的CPU、内存和磁盘使用情况?...
- Linux中打开文件管理器的命令
- java的多态怎么理解_JAVA多态的理解
- NYOJ4——ASCII码排序
- jdk在Windows下为什么要配置环境变量(引用)
- PHP学习记录(一)
- 68.TextView设置中划线、下划线
- VS挤房间探索(含源码)
- python中pandas库的作用_python之pandas库详解
- ApacheCN 翻译/校对/笔记整理活动进度公告 2019.10.4
- macbookair有没有touchbar_高配MacBook Air和低配MacBook Pro选哪个?
- 微信小程序canva生成图片,长按图片识别小程序二维码详解
- Platform 概述