目前在人工智能领域,不管是学术圈还是工业圈,大家都认同一个趋势,那就是在很多应用场景上计算需要落地到设备上,让设备拥有智能化——即嵌入式的AI,这个是人工智能领域新开辟出的一个分支。

中科创达技术总监王璠坚定的对雷锋网说。

在近日(4月28日)的北京GMIC大会新技术演示Show上,王璠向外界展示了中科创达在嵌入式人工智能方面所做的工作。这位百度出身的90后的技术总监,目前带领着一支30人的 ThunderView 技术团队专注于嵌入式AI的算法研究。我们现在做的工作是将深度学习放在嵌入式设备上,王璠进一步解释道。

↑ 王璠

那么什么是嵌入式 AI 呢?

据雷锋网了解,所谓嵌入式AI,就是设备无须联网通过云端数据中心进行大规模计算去实现人工智能,而是在本地计算,在不联网的情况下就可以做实时的环境感知、人机交互、决策控制。

谈及嵌入式AI和云端计算的AI的区别,王璠告诉雷锋网,对于一般的AI系统,数据可以在服务器端进行计算,人们往往会通过增加模型的大小、网络的深度,调用尽可能多的计算资源,以期得到更加精确的计算结果。而对于嵌入式AI来说,就需要反其道而行之了,王璠总结道,云端计算的AI致力于如何更好的解决问题,而嵌入式的AI则致力于如何更加经济的解决问题。

嵌入式AI的应用场景有哪些?

对于嵌入式AI的应用场景,王璠表示,云端计算虽然精确度高,但并不是所有的场景都适合,比如:

  • 辅助驾驶或者自动驾驶系统,如果在云端计算,设备端采集到数据后上传,计算完成后再返回终端,这样会不可避免的带来一定的延时,而在驾驶的场景中,这种延时意味着危险系数的提高。

  • 数据安全,比如家里安装了一个监控摄像头,用来关注老人和孩子的安全,上传到云端的计算也意味着隐私被泄露的风险提升。

  • 脱机,虽然现在通信技术发展的很快,但是仍然会碰到在地下停车场、商场里没有信号的情况,这时候就不能指望云端计算有很好的用户体验了。

所以,嵌入式的人工智能还是有很大的市场需求的。

同样是做嵌入式的人工智能,地平线CEO余凯曾经说过,嵌入式AI的应用场景地平线看好三个方向:安防、智能家庭、智能驾驶。对此,王璠也表示赞同,同时表示这三个方向在实现难度上也是逐渐递增的。

从算法方面来看,目前ThunderView算法解决方案包括深度学习算法、算法优化、算法集成三个部分。王璠提到,深度学习算法和算法优化这两个部分在执行过程中是高度耦合在一起的,同时算法优化部分的工作非常重要,难度也最大。目前他们已经在图像处理、机器视觉等领域取得了一些成果,王璠告诉雷锋网:

在2017年的国际消费类电子产品展览会(CES)及世界移动通信大会(MWC)上,我们团队携手高通公司在高通展台上展示了我们的物体识别及智能拍照引导算法。这些算法独立运行在高通的便携设备上,支持单机运行,不需要联网。实时识别物体,实时对用户的拍照行为进行引导。

也是在今年的MWC上,我们联合ARM公司在ARM展台展示了食品识别及热量估算的算法。利用在ARM设备上的深度学习引擎,我们在ARM双摄设备上展示了食品识别和热量估算的移动应用程序。

↑ MWC2017高通展台展示的ThunderView 算法技术

因为对于深度学习的网络模型而言,如果一个应用场景优化的比较好的话,是可以将其适配到不同的任务中的。所以目前我们的选择是先把基本场景做好,然后再将技术推广至不同的领域。比如现在和高通的合作是在检测方面,和ARM的合作是在分割和识别方面,而我们的目标是要在每一个领域至少做到业界 state of the art 的水平,王璠信心满满的告诉雷锋网(公众号:雷锋网)。

那么如何更加经济的用嵌入式AI解决问题呢?

王璠表示,嵌入式设备的计算资源有限,虽然移动芯片的计算能力突飞猛进,拿现在能力最强的高通骁龙835为例,它的单精浮点运算性能为630GFLOPS,比起2000年前后的超算,已经可以进入前100了。但是比起现在PC端的Tesla P100,其单精浮点运算性能可达10TFLOPS,仍有十几倍的差距。这就意味着嵌入式AI和PC端的玩法将完全不同。

一般来说嵌入式的开发层级从上到下可以分为:应用层(Application),算法层(AI Algorithms),操作系统层(OS),驱动层以及芯片层。由于移动芯片计算能力的限制,嵌入式人工智能除了需要优化算法层之外,还需要关注底层驱动和操作系统的优化——这就需要算法团队不仅在操作系统领域里经验丰富,还需要和芯片厂商有紧密的合作。

同时,对于嵌入式,用户对功耗和发热等性能要求又极为敏感。所以王璠表示,综合这些因素后,现阶段我们做嵌入式的计算必须要有高效、经济的算法。而要达到这个目标,则需要从硬件和软件两方面着手。

硬件

对于中科创达,硬件是基于高通、ARM这些厂商的芯片。不仅如此,王璠提到,他们在技术层面的合作已非常深入,目前的合作方式为硬件厂商开发加速引擎,并将芯片提前提供给中科创达算法团队来开发技术,这个过程中硬件厂商会基于算法团队提出的一些意见来改进引擎。王璠举了个例子,中科创达在MWC2017上和高通合作系统,高通在硬件优化上面提供了很大的帮助,他们内部开发了一个完全针对与深度学习算法的加速引擎,使运算获得了5倍左右速度的提升。一个好的引擎,可以让AI系统落地到嵌入式设备上取得事半功倍的效果。

软件

软件方面则需要更加经济的计算模型,在保证准确率的前提下,尽量减少计算量。

首先是一个经济的网络设计。

用深度学习的方法来处理AI,很多时候是一个搭积木的过程。随着现在人工智能方面开源的程度越来越大,从网上能得到的公开资源诸如文章、网络结构、评测、训练好的模型等等都很多,善用这些资源,把各模块嵌到网络里面,达到既满足你当前的需求,又具有更好效果的网络。

第二,从繁入简。传统的AI的算法,都是在一个很庞大的集群来运行的。在这种情况下,网络的大小可能到几百兆,甚至几个G,速度也比较慢。假如要放到嵌入式上,就需要从繁入简。这里有两个方法:

  • 一个是老师-学生模型,设计一个小网络,从原有的复杂网络里面学习它的知识。典型的方案是 Hinton 提出的模型蒸馏,包括现在很多的半监督学习也会用类似的方式来做。这是特别有效的缩减网络规模的方式。

  • 另外一点就是裁减和近似。这里的关键在于缩减之后,很可能会降低性能,这时就需要算法工程师需要做出平衡和取舍了,什么样的程度才可以在满足当前需求的同时达到最佳的效果。

第三点,适用场景。对于不同的任务场景,最优的网络设计是不一样的。尤其在嵌入式上,需要尽可能的让运行速度更快。测试集和用户实际使用场景是不一样的,所以在模型设计好后还需要根据用户可能碰到的实际情况做适配。

↑ MWC2017ARM展台展示的ThunderView 算法技术

第四点是共享参数。尽可能的用同一套参数来完成多种不同的任务。比如在MWC上,创达和ARM联合做的一个技术,主要是做食物的识别和卡路里的计算。我们需要完成的任务,降到算法层级来说,需要第一知道是什么食物,第二要知道这个食物在哪里,轮廓是多大,知道体积后才能估计它有多少卡路里。在做食物分类的时候,在深度学习的参数内部已经包含了很多关于这个食物的信息。当最后把分割任务加进去的时候,实际上并没有浪费任何一个多余的参数,只是最后抽出来一些特征,做一个简单的拟合,就可以得到一个比较好的效果。

最后,王璠总结道,要想嵌入式人工智能玩得好,必须做到软硬件的充分结合。

本文作者:谷磊

本文转自雷锋网禁止二次转载,原文链接

专访中科创达王璠:怎样做好嵌入式人工智能的算法开发?相关推荐

  1. 专访中科创达软件工程师龙辉:Idea赋予实践的演进之路

    智能化时代到来,让身边越来越多的生活用品开始向智能化转变,同时也吸引了大量开发者的目光,他们希望通过自己的idea来改变人们的生活.但对于初学者而言,如何将自己的Idea赋予实践绝非易事.为此,中科创 ...

  2. 中科创达副总裁孙力:AI视觉仍在路上,平台需求胜过算法

    从2018年AIoT产业布局来看,主要有以下几个大的趋势: 边缘计算不断被强调,存储.计算的布局重点从云端回到边缘侧: AI被不断强调,整个行业从强调IoT连接到AI赋能: 产业落地提上日程,各类行业 ...

  3. 域控赛道/智驾国产化启动,中科创达不想只是吃「软饭」

    今年2月,在投资者互动平台,中科创达关于公司是否与德赛西威有竞争关系的问题时,这样回答:我们是智能操作系统平台技术公司,操作系统软件能力始终为公司核心竞争力. 公开信息显示,中科创达形成了从硬件驱动. ...

  4. 中科创达孙力:不迷信 AI 算法,智能视觉如何转型升级?

    作者 | 若名 出品 | AI科技大本营 近日,中科创达副总裁孙力在 Thunder World 2018 嵌入式 AI 人工智能技术大会上发表了主题演讲,主要分享了以下三方面内容: 视觉的传统技术和 ...

  5. 融合智能将成时代方舟?中科创达技术大会向未来答疑

    人如一叶扁舟,在时代的洪流面前会显得那样渺小.那么什么才是时代的洪流呢?智能化毫无疑问会是其中之一.今年在全球受到疫情和不确定因素影响的情况下,智能化发展脚步不退反进,越来越多的企业和个人加入了智能产 ...

  6. 亚马逊云科技 + 英特尔 + 中科创达为行业客户构建 AIoT 平台

    随着5G.云计算.人工智能.大数据等新兴技术的快速发展,全球正加速迈入万物互联的新时代.中国本土 AIoT 企业在产品和技术创新上的不懈努力让产品不断成熟,加之国内市场竞争日趋激烈,为了抢占更广阔的市 ...

  7. 中科创达发布融合智能泊车技术于解决方案

    近日,中科创达作为全球领先的智能操作系统产品和技术供应商,在 CES 2022 上发布业界领先的智能泊车技术与解决方案--中科创达融合智能泊车. 不同于行业现有泊车方案,中科创达融合智能泊车基于中科创 ...

  8. 问题总结两天来两场实习面试(中科创达、华为)

    查了好多资料,发现还是不全,干脆自己整理吧,至少证保在我的做法正确的,以免误导读者,也是给自己做个记录吧! 昨天下午去的中科创达口试 今天下午刚刚结束为华的练习生口试,月五二号去上机试笔,月五八号通知 ...

  9. 中科创达C++ 二面(hr面,30min,offer)

    中科创达C++ 二面(hr面,30min,offer) 面试官问 自我介绍 技术面已经过去一周了,你对技术面试的总体感觉怎么样呢 问一下,你现在秋招的面试的进程怎么样了呢 目前收到了多少offer呢? ...

最新文章

  1. ccie对java有用吗,Java和ccie有啥区别
  2. python-管理MySQL之ConfigParser模块
  3. linux java ocr_Linux环境如何支持使用tess4j进行ORC
  4. VTK:小部件之BorderWidget
  5. android 自定义特效,Android自定义FloatingText仿点赞+1特效
  6. lua如何判断是否支持cookie_如何判断页面布局是否合理?
  7. 类构造函数(Constructor)单冒号:用法
  8. Django常见面试题总结(一)
  9. python编程招生海报_怎么用ps做招生海报
  10. 提示:请安装TCP/IP协议.error=10106。解决方案
  11. AutoIt教程资源汇总
  12. Hive—日期格式使用总结
  13. Processing鼠标键盘
  14. Task07: 凸优化;梯度下降;优化算法进阶 学习笔记
  15. 时间同步装置(卫星时钟同步)工作原理介绍
  16. (已修正精度 1mm左右)Realsense d435i深度相机+Aruco+棋盘格+OpenCV手眼标定全过程记录
  17. 微信报错errcode大全
  18. 进程创建-终止-等待-替换
  19. linux ftp连接超时(10060),实在搞不定了,求助!WDCP FTP登录失败,提示错误10060
  20. SpringBoot系列之@PropertySource读取yaml文件

热门文章

  1. Java集合—哈希(hash)表
  2. maven(android-maven-plugin3.8.0)打包apk无法启动,apklib依赖包的资源索引出错(R文件与主模块冲突)问题解析
  3. [RN] React Native 调试技巧
  4. [Bootstrap-插件使用]Jcrop+fileinput组合实现头像上传功能
  5. 实验室信息管理系统(南京浩展软件)
  6. shell 数组操作
  7. mysql 利用binlog增量备份,还原实例
  8. Teamprise Readies Java SDK for TFS
  9. 学习Java编程到底是为了什么,该具备什么样的能力
  10. ADS_LPC2103开发板SPI 4位数码管测试试验