导语:目前市场上还没有足够优秀的安防前端的通用芯片,也没有一款很适用安防的AI芯片出现。

制约AI安防芯片规模化应用的核心技术问题是什么?

这是不少芯片企业面对安防场景时,不断向自己提出的疑问。在提高AI安防芯片性能,加强算力的同时,从业者们也逐渐发现,芯片中最为关键的其实并不是单纯提升算力,如果不进行存储优化,那么芯片实际提供的计算力会大大降低。

“要突破AI芯片的瓶颈,并不能只是简单的增加计算算力,而是一定要把数据存储管理做好。”探境科技创始人兼CEO鲁勇说道。而对于存储问题的解决,仍是一个探索中的新方向。

阻碍AI芯片的内存墙问题

AI芯片对于传统芯片带来的挑战,并不只是计算架构上的,更多是在存储架构间的。

传统的芯片采用的是冯·诺依曼架构,其核心架构中计算模块和存储单元是分离的。CPU和内存条并不集成在一起,只在CPU中设置了容量极小的高速缓存。

也就是说,CPU在执行命令时必须先从存储单元中读取数据。每一项任务,如果有十个步骤,那么CPU会依次进行十次读取,执行,再读取,再执行……这就造成了延时,以及大量功耗花费在数据读取上。

这一问题也被称为传统芯片的“内存墙”问题。

而在AI 应用中,冯·诺伊曼“瓶颈”问题显得愈发严重。AI依赖的算法是一个庞大和复杂的网络,有很多参数要存储,也需要完成大量的计算,这些计算中又会产生大量数据。在完成大量计算的过程中,一般芯片的设计思路是大量增加并行的运算单元,例如上千个卷积单元,需要调用的存储资源也在增大。

不夸张地说,AI初创芯片公司虽然采用不同的路径打造芯片,但事实上都在努力对这一问题予以解决。大部分针对 AI,尤其是加速神经网络处理而提出的硬件架构创新,都是在与这个问题做斗争。

而成立于2017年的AI芯片初创公司探境科技,也在这一路途上跋涉。不过不同的是,探境科技选择另辟蹊径,直接从存储子系统的优化入手,解决“内存墙”问题。

自研存储优先的SFA架构

而如何解决这一问题呢?

目前解决这一问题的方法有几种,较为常见的方法是加大存储带宽,采用高带宽的外部存储,以及从算法入手,设计低比特权重的神经网络。

除此之外,存算一体化也被看做是未来的发展方向,在实现上也分为不同的路径。

其一是SSD中植入计算芯片或者逻辑计算单元,可以被叫做存内处理或者近数据计算,这其实是深度学习的一种应用场景,并非是AI芯片架构的创新。

另一种就是存储和计算完全结合在一起,使用存储的器件单元直接完成计算,比较适合神经网络推理类应用。

而探境科技则另辟蹊径,提出了完全不同的解决方案。

鲁勇提到,并不认同目前存算一体的处理方式,主要原因是成本太高,并不符合市场需求。

“存算一体的处理方式,其实违反了芯片中的成本结构。芯片中,之所以设计和区分片上的缓存SRAM,及片外的DRAM,就是因为如果所有存储都放入芯片内部,成本就大幅上升,会上升几十倍到上百倍。”

因而,抛开将存储全部放入芯片内部的方式,探境科技自创了SFA(Storage First Architecture,简称SFA),即存储优先架构。

不同于常见的解决内存瓶颈的方法,SFA是“以存储调度为核心”的计算架构,数据在存储之间的搬移过程之中就完成了计算,计算对于数据来说只是一种演变。

“与通常计算的先有计算指令然后提供数据相反,SFA架构,存储是我们优先的出发点。考虑数据在搬移过程中做计算,也就是由数据带动计算而非由算子带动数据。”鲁勇进一步解释。

这一点与AI大神Lecun所宣称的所有的神经网络都是图计算问题不谋而合。

那么打破传统冯·诺依曼架构,自研存算一体架构的依据是什么?

这可以谈到人类大脑的存储和计算方式。从生物角度讲,大脑存储大量的知识,能够快速提取并访问,而大脑的内存和计算并不是分开的,更多的是存在一定的相容性。因而,未来的计算机可能不是基于计算的memory,而是基于memory的计算,更多做到融合。

不过,因为当前芯片领域对于AI算法的关注还较多,针对AI的结构改进尝试还偏少。未来,memory与computing结合的尝试,会更可期。

鲁勇也介绍道,目前专注于从存储子系统入手,着力解决AI芯片的存储计算架构问题的企业并不多,而其中很多公司从事的都是成本结构并不合理的存算一体架构,符合合理的成本结构并优化存储子系统的公司更是屈指可数。

安防还未有一款真正适用的AI芯片

安防作为计算机视觉较快落地的领域,也成为探境科技较为看好的场景之一。

探境科技的创始人兼CEO鲁勇,出身全球十大芯片厂商之一的Marvell半导体,是位在半导体业摸爬滚打了15年的老兵。

在成立探境科技之前,鲁勇曾是Marvell半导体的中国芯片研发总监。据鲁勇介绍,在Marvell这十年里,他从零开始,一手搭建了Marvell的中国芯片研发团队。

探境科技创始人&CEO  鲁勇

在创立探境科技之前,几位在海康威视、大华股份等安防巨头中任职的朋友都陆续来找到鲁勇,咨询英特尔Movidius VPU是否能够适用于终端AI处理的需求。

鲁勇认为,目前市场上还没有足够优秀的适合安防前端的通用芯片,也没有一款很适用安防的AI芯片出现。不过Movidius的火爆,恰好说明了市场对边缘端芯片的强大需求。

于是,2017年,鲁勇决定离开Marvell,与一群老朋友成立了探境科技。

在安防领域里面,有大量的算法需要前置。目前的算法基本都是基于深度学习。

而探境科技的芯片,如何更好适用于安防大量非结构化数据的处理需求呢?

鲁勇讲到,安防领域的数据特点,主要在于需要实时的处理大量连续的图像数据流。“安防领域的数据处理,在于两个维度。第一是每秒处理帧率要越来越高,第二是图像分辨率上要高。在这两个维度上,安防对边缘芯片提出了要求。”而探境科技的优势则在于,基于SFA架构,能更好优化存储和计算,从而更好解决这一问题。

安防领域,边缘端的芯片,已有不少厂家入场。其中大厂有之,明星初创公司亦有之。

目前来看,边缘终端市场有两种形态的芯片产品,一种是针对特定应用的SoC,一种是通用加速器做独立芯片。

如在安防领域,SoC面向专用市场,在芯片中深度学习加速计算事实上只是一部分,而其他大部分芯片面积则交给了主控处理器、视频解码等模块。

终端通用深度学习加速器芯片市场的应用则刚起步。许多公司的市场布局主要一是培养开发者生态,另一方面也探索研究哪一领域最有潜力,针对几个重要的场景推出相应的优化芯片。而探境科技的目标就是做支持所有神经网络的通用型AI处理器。不仅在安防领域,也瞄准了其他应用场景。

鲁勇认为,探境科技基于SFA架构的AI芯片,在优化了存储架构的同时,能够适用于智能家居、智能安防、智能穿戴、智能车载、智能外设等更多场景,低功耗低效能的解决更多问题。

目前,探境已量产了应用这一架构的语音识别芯片音旋风611,视觉芯片今年下半年也将发布。

AI芯片,登高需防跌重

但实际上,近两年,许多AI企业的芯片纷纷宣布流片,尤其针对安防领域的芯片并不少,但似乎还并未出现强势的对传统芯片的替代或继任者。而作为一个芯片界的老兵,如何看待AI芯片行业的发展呢?

鲁勇认为,AI芯片确实是被公认的一个国内企业弯道超车的机会。相较于国外更看重云端场景,国内有在边缘端有大量市场,这为国内AI企业在边缘芯片的发展提供了良好的机会。

但国内虽有很多公司关注对AI芯片的底层架构的研发,也有不少AI芯片公司“只追求有,不追求好”,用拼凑的方式来做芯片。很多公司为了顺应市场形势,将自己包装为一个AI芯片公司。这样就给市场造成了很大泡沫。并且,国内AI芯片企业,也普遍缺乏后端设计的人才。

后端设计相对于前端的逻辑设计,更多涉及到芯片的工艺,也相对更需要丰富的经验。国内在后端设计人才上更为紧缺。因而,很多厂商会通过外包的方式做后端服务,来完成生产。这对芯片厂商来说,其实是一个很大的竞争劣势。

AI芯片,“登高”似乎也面临着“跌重”的风险。

不过,大浪淘沙。在2017年就看到,并率领团队致力于解决AI芯片中的存储问题,鲁勇显然对自己和探境科技都更有信心。

“芯片,作为一个赢者通吃的行业,对技术和产品的能力要求都非常高。行业最终会看到,技术和产品会主导AI芯片的格局。具备两者实力的AI芯片公司,会最后存活下来。”鲁勇说道。

安防行业为何缺少真正适用的AI芯片?相关推荐

  1. 安防行业成巨头必争之地 一文梳理安防AI芯片产品与主要企业

    http://www.smartcn.cn/186726.html [导读] 在人工智能兴起之后,安防市场就成为了其全球最大的市场,也是成功落地的最主要场景之一.对于安防应用而言,智慧摄像头.智慧交通 ...

  2. 【深度学习】AI芯片:上游产业率先爆发

    深度学习要求极高的并行计算能力,大数据.算力.训练方法等领域的突破使AI芯片作为上游产业率先爆发. 人工神经网络通过训练与预测的过程实现应用,对并行计算能力要求高,训练偏好高性能,预测对简单指令重复计 ...

  3. 2019年AI芯片产业深度研究报告

    一. 人工智能芯片发展现状及趋势 1.深度学习算法对芯片要求更为苛刻,通用 CPU 性价比相对较差 经历了 60 多年的起起伏伏之后,人工智能终于迎来了第三次爆发.第三次爆发的核心引爆点是深度学习算法 ...

  4. 【AI芯片】2019年AI芯片产业深度研究报告

    程序员的日常 转发文章最多的朋友可以免费进入价值99元的<湾区AI精英会>海归圈子 一. 人工智能芯片发展现状及趋势 1.深度学习算法对芯片要求更为苛刻,通用 CPU 性价比相对较差 经历 ...

  5. AI芯片结构目标图形处理

    AI芯片结构目标图形处理 AI chip architecture targets graph processing 东京--AI处理器设计师Blaize,原名ThinCI(发音为"Thin ...

  6. 算力至上?四大AI芯片大对决

    来源 | 老石谈芯(ID: laoshi_tanxin) 目前,全世界超过90%的数据都是在过去的两三年之内产生的.随着人工智能.自动驾驶.5G.云计算等各种技术的不断发展,海量数据都将会继续源源不断 ...

  7. 中国首场AI芯片产业峰会成功举办 GTIC 2018热度空前

    2018年3月9日,由智能行业第一媒体和产业服务平台智东西主办.全球好物消费推荐平台极果和中国家电及消费电子博览会AWE联合举办的"GTIC 2018 全球AI芯片创新峰会"在上海 ...

  8. AI芯片进入新阶段 哪种企业能胜出?

    https://www.toutiao.com/a6672909090647179790/ [中国安防展览网 企业关注]转眼间,"AI芯片"这个概念已经火了两年.随着2018年的结 ...

  9. AI芯片下一步怎么走?“从软件中来,到软件中去”

    https://www.toutiao.com/a6672883474858246664/ 从当前的市场格局看来,不少应用场景诸如智慧社区.智慧楼宇.智能安防.智慧商业等,用传统的通用型芯片来做AI运 ...

最新文章

  1. Centos7下安装Docker
  2. http://m.blog.csdn.net/article/details?id=2630620
  3. OJ系列之---单词倒排
  4. Vasya and Robot
  5. 长城汽车:魏牌宣布涨价 咖啡系部分车型上调5000-12000元
  6. codeblocks主题修改(vim)
  7. access mysql 同步,SQLServer2008 同步Access数据库
  8. 带你全面了解Http和Https(开发人员必备)
  9. bzoj3514 Codechef MARCH14 GERALD07加强版 lct预处理+主席树
  10. Struts数据传输问题-- 数据超出2M时会导致映射数据丢失
  11. 推荐一款数据恢复软件(迅龙数据恢复)
  12. 111-GAMP处理流程
  13. STM32官方编程IDE及烧录软件介绍
  14. 单位内网视频会议怎么开
  15. 应用二 stm32使用esp8266进行串口wifi通信
  16. 30秒教会您Orange一键资源采集功能
  17. iphone视图屏幕元素-像素大小 目前iphone,ipod touch 屏幕:320*480
  18. java中date和时间戳相互转换以及获取前一个小时的时间
  19. PAT乙级_1068 万绿丛中一点红 (20 分)_python
  20. 2022非常火过postman的一款技术人必备的接口测试神器:Apifox

热门文章

  1. nn.embding()使用注意点
  2. scikit正则化 API
  3. oracle 和 ' 特殊字符处理
  4. 10搜索文件内容搜不出_百度搜索广告太多?内容太杂?可能你们缺少这10个神器网站...
  5. 周伯文对话斯坦福教授曼宁:人机对话智能新进展需要新“图灵测试”
  6. 《征服C指针》作者语录
  7. 学习不同编程语言的重要性
  8. 像优秀的SQL程序员一样思考
  9. PyTorch基础入门五:PyTorch搭建多层全连接神经网络实现MNIST手写数字识别分类
  10. Pytorch-学习记录 卷积操作——Tensor.size()