AI芯片加速图像识别

AI chip accelerates image recognition

法国研究机构CEA-Leti和LIST在2020年VLSI研讨会上展示了一种概念验证芯片,该芯片集成了低功耗物联网节点和人工智能加速器,并展示了超快的唤醒时间,峰值至空闲功耗降低了1500倍。对于机器学习任务,该节点每秒可提供高达1.3tera次运算/瓦特(TOPS/W)或36个gop。

这款名为SamurAI的芯片在占用检测系统中进行了测试,该系统包括PIR传感器、224×224像素黑白摄像头、FeRAM和低功率收音机。日均系统功耗为105µW,SamurAI消耗了预算的26%。该系统使用PIR传感器,每天占用房间8小时,间隔5s,摄像机每秒1帧,收音机10x。

SamurAI System

amurAI使用了两个片上子系统:一个低功耗的无时钟事件驱动唤醒控制器,可以在207ns内启动;一个按需子系统包括一个具有深度睡眠模式的RISC-V CPU加上PNeuro-AI加速器和密码加速器。

这种双子系统方案可以实现15000倍的峰值与空闲功率比。下图显示了不同模式下的功耗;空闲模式仅消耗6.4µW。在CPU和AI加速器运行的情况下,功耗为96 mW。

该芯片基于STMicro的28nm全耗尽绝缘体上硅(FD-SOI)工艺,功率图在没有体偏压的情况下给出。硅的尺寸为4.5mm2,具有6个可切换的功率域。

SamurAI power consumption measurements by power modes (the modes are L-R: idle, wake-up controller (WuC) only, wake-up controller and wake-up radio (WuR), wake-up controller and peripherals, and CPU running

AI accelerator

该芯片的人工智能加速器,这个团队称之为PNeuro的设计,是一种单指令、多数据(SIMD)可编程加速器。它由2个32x 8位处理单元组成,带有264kB多银行SRAM。它可以执行多达64个乘法累加(mac)每个周期。PNeuro块在2.8gops/0.48V时可以达到1.3tops/W,对于8位全连接的神经网络层,它可以在0.9V下达到36个GOPS。

与使用控制器RISC-V内核进行ML计算相比,使用PNeuro加速器使系统的总功耗降低了2.3倍。

SamurAI’s two-cluster PNeuro accelerator with 64 processing elements total

PNeuro’s energy efficiency is 1.3 TOPS/W maximum and performance is 36 GOPS maximum。

该设计是为物联网应用而设计的,在长时间的“睡眠”之间需要零星的计算能力。与其连接到云端,如果节点本身能够处理AI工作负载,则通常可以更快地完成,并且由于数据不在系统外部共享,因此不会涉及隐私。这可能包括使用摄像机或其他传感器进行人员检测或场景识别等应用。

AI芯片加速图像识别相关推荐

  1. 国产AI芯片加速,鲲云携手浪潮推出数据流AI服务器

    近日,鲲云科技携手浪潮基于星空X3加速卡推出新一代的数据流AI服务器,定位高性能图像视频智能分析的AI计算加速,支持智慧城市.智能制造.智慧油田.智慧工地.智算中心等典型AI应用场景,这是双方&quo ...

  2. Tengine全面支持寒武纪思元芯片平台,共同推进AI芯片加速之路

    近日,OPEN AI LAB(开放智能)面向AIoT场景推出的边缘AI计算框架Tengine与寒武纪达成深度战略合作,全面支持了寒武纪思元220的芯片平台,实现思元220可以加载使用Tengine的t ...

  3. TensorRT加速 ——NVIDIA终端AI芯片加速用,可以直接利用caffe或TensorFlow生成的模型来predict(inference)...

    官网:https://developer.nvidia.com/tensorrt 作用:NVIDIA TensorRT™ is a high-performance deep learning inf ...

  4. 一文读懂寒武纪:AI芯片拓荒者的乘风破浪

    点击上方蓝色字体,关注我们 6月24日,寒武纪科创板IPO注册生效,这家成立于2016年的初创公司,从IPO申请到过会再到正式注册批文下来,仅仅用时89天. 顶着"AI芯片独角兽" ...

  5. 深度 | AI芯片之智能边缘计算的崛起——实时语言翻译、图像识别、AI视频监控、无人车这些都需要终端具有较强的计算能力,从而AI芯片发展起来是必然,同时5G网络也是必然...

    from:https://36kr.com/p/5103044.html 到2020年,大多数先进的ML袖珍电脑(你仍称之为手机)将有能力执行一整套任务.个人助理将变的更加智能,它是打造这种功能的切入 ...

  6. 【AI简报20220311期】汽车AI芯片竞赛加速、苹果最强芯M1 Ultra登场

    AI芯片 1. 汽车AI芯片竞赛加速 瑞萨推R-Car V4H SoC 原文: https://xw.qq.com/amphtml/20220309A06L9100 3月8日,瑞萨宣布推出R-Car ...

  7. 解密AI芯片的加速原理

    网上对AI芯片的剖析实在太少,这里对一些论文和大佬的研究做一个总结,希望对读者有所帮助. AI 芯片的诞生 讲到半导体,不得不从摩尔定律说起.从Intel创始人戈登·摩尔提出摩尔定律到现在已经53年了 ...

  8. arduino 勘智k210_嘉楠一代AI芯片勘智K210功耗仅0.3W  加速国产AIoT架构轻量化

    原标题:嘉楠一代AI芯片勘智K210功耗仅0.3W  加速国产AIoT架构轻量化 AIoT正重塑人们的生活场景.无论是客厅里的智能音箱.自动驾驶系统,还是机场安检口的人脸识别闸机,终端设备越来越聪明, ...

  9. AI芯片行业发展的来龙去脉

    作者 | 清华大学微电子学研究所尹首一 来源 | <微纳电子与智能制造>期刊 引言 人 工 智 能( aritificial intelligence ,AI )是 一 门融合了数学 .计 ...

最新文章

  1. Hadoop集群搭建(七:MySQL的安装配置)
  2. 从1G到5G,从回顾过去到展望未来
  3. Maven打包web项目报错:webxml attribute is required (or pre-existing WEB-INF/web.xml if executing in update)
  4. 【译】IPFS — The Permanent, Distributed Web
  5. VC调用C#写的DLL
  6. python如何运行源文件_Python如何运行
  7. 2万字带你攻略掉Selenium
  8. 跨境电商ERP系统的相关信息?
  9. Python:列表list对应项求和
  10. C语言和C++中如何编写交换两个整形变量值的函数
  11. 434.字符串中的单词数
  12. Hibernate入门教程
  13. 2021年软考网络工程师专题突破视频教程
  14. 金蝶盘点机金蝶条码管理方案实施金蝶仓库条码管理实现方法
  15. 塑料管检测内容有那些
  16. 华为机试题:求偶数个复数的平均值
  17. 刷屏专用超长复制_跪求超超长刷屏字符剑。。
  18. 关掉Win Server2003 IE增强的安全配置堵塞
  19. 极兔快递单号查询API
  20. 怎么做表情包微信gif?好用的制作方法介绍

热门文章

  1. libACE-6.3.3.so: cannot open shared object file: No such file or directory
  2. 【置顶】利用 NLP 技术做简单数据可视化分析教程(实战)
  3. centos使用yum快速安装java的方法
  4. c语言函数传参时候的类型强制装换
  5. 每个年龄段,都有每个年龄段的“好”
  6. 根据JSON自动生成select联动
  7. 矩阵拼接 cat padding_pytorch
  8. 用于ONNX的TensorRT后端
  9. Python分析离散心率信号(下)
  10. 硬件加速器为人工智能应用服务