AI芯片体系结构目标图形处理

AI chip architecture targets graph processing

可编程图形流处理器(GSP)能够执行“直接图形处理、片上任务图管理和执行以及任务并行性”。设计GSP是为了满足人工智能处理的需求,而这些需求以前是GPU、CPU或DSP无法满足的。

GSP体系结构由一系列图形流处理器、专用数学处理器、硬件控制和各种类型的数据缓存组成。GSP可以提供:“真正的任务级并行,最小限度地使用片外存储器,深度优先的硬件图形调度,完全可编程的体系结构。”

图形计算

虽然人工智能有许多不同类型的神经网络,所有的神经网络都是基于图形的,这允许开发人员利用图形原生结构在单个架构上构建多个神经网络和整个工作流。

然而,在图形计算领域,人工智能处理中需要“数据流图的优化和编译”。

GSP声称在三个方面与其他基于图形的数据流处理器有所不同。

首先,“完全可编程的”,能够执行“广泛的任务”。

其次,它是“动态可编程的……在一个时钟周期内”

第三,“提供流媒体的集成”,这使得最小化延迟成为可能。这种巨大的效率倍增器是通过“数据流机制”实现的,在这种机制中,非计算性数据移动被最小化或消除。

GSP体系结构的图形本机特性可以最小化数据在外部DRAM之间的来回移动。外部只需要第一个输入和最终输出,而中间的其他数据只是临时的中间数据。这将大大减少内存带宽和功耗。

在芯片、板和系统级别上尽可能降低延迟、减少内存需求和能源需求。

试点项目的经验教训

通过尽早推出GSP嵌入式桌面设备,“我们获得了进入真正客户及其工作负载需求的入场券。”
通过这些试点,基于GSP的平台有更多的应用程序和细分市场。其普惠制解决的市场范围从汽车和智能视觉(监视)到企业计算。

GSP可以满足从云中的数据中心到收集数据的边缘的所有地方施加的较低的能量限制。
GSP的驱动力正在迅速改变深度学习技术,包括新的拓扑、神经网络和算法。如此快节奏的技术进步常常促使客户希望芯片能做XYZ。这就是完全可编程的GSP架构发挥作用的地方。
例如,在汽车领域,GSP将应用于智能远程信息处理、ADAS、驾驶员监控和乘客评估。关键是许多汽车应用的单一GSP体系结构。

例如,单芯片可以结合激光雷达传感器输入和点云进行ISP处理、语义分割和传感器融合。这是通过视频目标检测和激光测距两个并行执行的数据流图来实现的。

由于GSP的主要市场是汽车(汽车客户总是要求确定性),GSP架构是“确定性的”。
最终开发了一个名为“Blaize NetDeploy”的工具。许多客户已经花了数周时间在优化GPU上经过训练的人工智能模型,并将其转换为在推理机上部署。一个软件工具,可以加速量化、修剪和压缩神经网络的过程。

AI芯片体系结构目标图形处理相关推荐

  1. AI芯片结构目标图形处理

    AI芯片结构目标图形处理 AI chip architecture targets graph processing 东京--AI处理器设计师Blaize,原名ThinCI(发音为"Thin ...

  2. 清华出品:一文看尽AI芯片两类瓶颈三大趋势,存储技术开拓新疆界 | 附全文...

    12月10日-11日,由北京未来芯片技术高精尖创新中心和清华大学微电子学研究所联合主办的「第三届未来芯片论坛:可重构计算的黄金时代」在清华大学主楼举办,并正式发布了<人工智能芯片技术白皮书(20 ...

  3. 清华发布《人工智能AI芯片研究报告》,一文读懂人才技术趋势

    来源:Future智能 摘要:大数据产业的爆炸性增长下,AI 芯片作为人工智能时代的技术核心之一,决定了平台的基础架构和发展生态. 近日,清华大学推出了< 人工智能芯片研究报告 >,全面讲 ...

  4. 清华出品:最易懂的AI芯片报告!人才技术趋势都在这里

    清华出品:最易懂的AI芯片报告!人才技术趋势都在这里 https://mp.weixin.qq.com/s/kDZFtvYYLLqJSED_0V1RZA 2010 年以来, 由于大数据产业的发展, 数 ...

  5. 华为、苹果、高通,谁在领跑?全面解读清华AI芯片报告

    来源:智东西 摘要:本文全面讲解人工智能芯片,系统梳理人工智能芯片的发展现状及趋势. 2010 年以来,由于大数据产业的发展,数据量呈现爆炸性增长态势,而传统的计算架构又无法支撑深度学习的大规模并行计 ...

  6. 2020 年,AI 芯片内存哪家强?

    目前多家公司都在开发网络边缘系统的AI芯片,本文作者详细分析AI边缘芯片遇到的问题和挑战,并给出一些新的内存技术解决方案. 作者 | Mark LaPedus 译者 | 弯月,责编 | 伍杏玲 封图 ...

  7. AI芯片行业发展的来龙去脉

    作者 | 清华大学微电子学研究所尹首一 来源 | <微纳电子与智能制造>期刊 引言 人 工 智 能( aritificial intelligence ,AI )是 一 门融合了数学 .计 ...

  8. AI芯片的“战国时代”:计算力将会驶向何方?

    CSDN 出品的<2018-2019 中国人工智能产业路线图>V2.0 版即将重磅面世! V1.0 版发布以来,我们有幸得到了诸多读者朋友及行业专家的鼎力支持,在此表示由衷感谢.此次 V2 ...

  9. 打开AI芯片的“万能钥匙”

    来源:雷锋网  作者:包永刚 雷锋网按,新推出的AI芯片因架构的独特性和软件的易用性增加了客户尝试和迁移的成本,因此,软件成为了能否快速.低成本迁移的关键.现在普遍的做法是在TensorFlow写一些 ...

最新文章

  1. C连接MySQL数据库开发之Windows环境配置及测试
  2. 在2012年安装XCODE旧版本的错误解决方法
  3. 数智德州,创新未来 | 智慧城市赛题上线山东大赛德州分赛场
  4. Kippo:一款强大的SSH蜜罐工具
  5. 关于用mybatis调用存储过程时的入参和出参的传递方法
  6. 操作系统的不确定性是指_读文||不确定性原理—人工智能的哲学基础
  7. 物联网学习之旅:微信小程序控制STM32(二)--ESP8266连接mqtt服务端
  8. 关于计算机教育的图表,计算机教育箭头环形图表PPT模版.ppt
  9. Windows系统磁盘清理C盘扩容
  10. CausalImpact
  11. wd移动硬盘不能识别_wd移动硬盘无法识别
  12. STM32用一个定时器封装多个定时函数调用
  13. Adobe Audition CC 2019 下载安装教程
  14. 机器学习中的评估指标与损失函数
  15. CREO图文教程:三维设计案例之矿泉水瓶实例图文教程之详细攻略
  16. linux下的文件搜索功能
  17. 天池训练营——基于人脸的常见表情识别(3)——模型搭建、训练与测试
  18. python实现坐标点的系统转换
  19. ArcGIS ArcTooBox中的工具执行没有结果的处理办法
  20. 自动驾驶论文:FisheyeMODNet: Moving Object detection on Surround-view Cameras for Autonomous Driving (2019)

热门文章

  1. 2022-2028年中国塑料编织品的制造行业市场竞争态势及投资方向分析报告
  2. 关于某日访问次数最多的IP的topK问题的三种解法
  3. 【C/S语言】.net平台
  4. 离线安装Visual Studio Code插件
  5. dropout,batch norm 区别 顺序
  6. 方差协方差以及协方差矩阵
  7. 小白给小白详解维特比算法(二)
  8. TVM如何训练TinyML
  9. 提示和技巧:光线跟踪最佳实践
  10. 2021年大数据ZooKeeper(二):ZooKeeper集群搭建