本内容选自清华大学电子系副教授、深鉴科技联合创始人汪玉于2018年4月27日在清华大学主楼接待厅数据科学研究院举办的第二届“大数据在清华”高峰论坛所做题为《针对机器视觉的深度学习处理器》的演讲。

注:后台回复关键词“0427”,下载完整版PPT。


视频时长约半个小时,建议使用wifi观看

汪玉:大家好,今天给大家汇报一下我们在过去所做的工作。

源自清华 以梦为马

我们团队目前有130个人,有50个清华的同学,覆盖了从软件、架构、芯片、硬件、算法到编译各个环节。今天讲处理器,包括因特尔在内的许多公司不仅仅做架构、做硬件,也有很多在做软件和算法。要让芯片给别人用起来,必须展示出别人能看得见的效果,并且要有很好的编译器。

自主研发 核心技术

给大家介绍一下我们自己的核心技术,讲一讲我们对于这个领域的看法。

说到深度学习,大家说为什么要针对深度学习做一个企业,而不是针对其他方面?深度学习本质上是一个拟合器,用神经网络把参数定下来,给足够多的X、Y做标记,从算法的层面上去支持不同的应用。

从2010年移动互联网普及之后,有标记的数据越来越多。神经网络可以提供方法,把数据利用起来。从CPU到GPU以及专用硬件,我们希望在个人终端领域,包括每个摄像头都可以做这样的网络。

从大的趋势,回顾整个历史阶段,都有一个关键的硬件(图片下方)。我们不知道在AI这个阶段,关键的硬件是什么,所以我们也非常高兴,能看到大家为这样一个核心的能力而去奋斗。

我们的途径是什么?图片下方是最关键的三个部分: DNNDK-软件工具链、指令级、体系结构。

上面给出的是所有算法对应的小模块,它的单元从砖头变成一面墙,所以针对深度学习的前项,有没有可能找到这些抽象的层次,这就是指令级。针对这样的抽象,我们可以满足这些抽象的硬件,需要把所有的神经网络变成指令的集合。由于硬件是固定的,所以只需要支持有限的操作。

对于一个系统,三个东西很重要,第一个是峰值能力,圈了多少个计算单元,多少人在帮你工作。第二个是如何让更高比例的人真正在工作。第三个是做同样的事情,需要的人数能否减少。这三个合起来,才有希望把整体性能提上去。

所有的行业都会拥有Data,训练好一个算法之后,我们可以进行压缩,变成我们所定义的指令的流,并且放在硬件上,形成系统解决方案。

为什么一定要强调软硬件协同?这有一张图,横轴是瓦数。不同的瓦数对应不同的应用领域,希望做的每一个瓦数,对应的性能足够高。

纵轴是性能-每秒计算的次数。图中的三角形表示芯片,能做到大概1T~5T/瓦,这基本是一条很难逾越的线。因此,光做芯片还不够,算法的优化也要做起来。

我们也尝试在做自己的IP。当时做芯片一次可能要投几百万美金,在设计芯片的时候,怎么去适应未来,怎样去把目前所有的网络支持好。你肯定要抽象出中间层次,中间层次的基本单元还要能够拼起来所有的网络,你又不知道未来的网络是怎样的。

在软件方面,我们做的都是神经网络,把不需要的边和点都去掉,就可以降低整体所需要的计算量。不能只是人工去做这些事情,如果你希望赋能所有的行业,我们还需要有一套工具链。用深度压缩工具,可以在CNN和和RNN上获得显著的压缩比,让算法更小、更快、更省功耗。

产品方案及应用

如何应用呢?我举例说明。

这是我们神经网络的加速版,在前端就可以做识别和比对,以后就不用传视频流和图片,传的有可能是特征值。相信在未来几年内,特征值会统一标准。

这是面向语音识别的应用。复杂的音箱对话,都会传到云端去做。我们可以用FPGA做,比CPU和GPU更快,且功耗更低。如果能提高单位功耗对应的计算能力,就可以服务更多的客户。

这是我们尝试在汽车端做的努力,背后由神经网络支撑。一辆车有多个摄像头,会集中到一个平台上做运算,原来可能是用GPU来做,现在我们也提供用FPGA来做。包括前端背后,可能也需要一个预处理的芯片,这个芯片也可以用FPGA来做。

我们更期待,做出来的芯片性能提升,成本下降,以替换已有更高代价的FPGA,以上就是我们在过去学术界做的一些工作,在公司应用和服务的案例,谢谢大家!

注:后台回复关键词“0427”,下载完整版PPT。


回顾4月27日第二届“大数据在清华”高峰论坛嘉宾演讲内容:

清华大学张长水:机器学习和图像识别(附视频、PPT下载)

清华大学刘知远:知识表示学习及其应用(附视频、PPT下载)

站立潮头、无问西东 | 第二届“大数据在清华”高峰论坛成功举办

整理:陈龙

校对:西葫芦

为保证发文质量、树立口碑,数据派现设立“错别字基金”,鼓励读者积极纠错

若您在阅读文章过程中发现任何错误,请在文末留言经小编确认后,数据派将向检举读者发8.8元红包

同一位读者指出同一篇文章多处错误,奖金不变。不同读者指出同一处错误,奖励第一位读者。

感谢一直以来您的关注和支持,希望您能够监督数据派产出更加高质的内容。

深鉴科技联合创始人汪玉:针对机器视觉的深度学习处理器(附视频、PPT下载)...相关推荐

  1. 深鉴科技联合创始人汪玉:针对机器视觉的深度学习处理器(附视频、PPT下载)

    几百个孩子围着3.4个水龙头 喝没有消毒过的生水, 在仅有的一盆别人用过的水里轮流洗漱, 这是四川广安市石笋镇白云小学 曾经令人心酸不已的场景. 他们过着城里人难以想象的生活,幸而,总有一帮帮陌生人在 ...

  2. 专访图麟科技联合创始人张勋:AI商用化时代,图麟科技率先抢占工业赛道

    AI全面商用时代来临,企业如何将技术落地,抢占市场高地? 8月30日,在2018中国(上海)国际人工智能产业大会上,图麟科技联合创始人张勋给出了他的答案.张勋表示:"技术落地并无捷径,除了扎 ...

  3. AI公开课:19.03.20吴甘沙-驭势科技联合创始人《AI时代的自动驾驶趋势》课堂笔记以及个人感悟

    AI公开课:19.03.20吴甘沙-驭势科技联合创始人<AI时代的自动驾驶趋势>课堂笔记以及个人感悟 导读       为什么要大大小小的公司都要做无人驾驶?因为它真的是一个很大的舞台,具 ...

  4. 前沿分享|数澜科技联合创始人副总裁 江敏:基于云原生数据仓库AnalyticDB PostgreSQL的最佳实践

    简介:本篇内容为2021云栖大会-云原生数据仓库AnalyticDB技术与实践峰会分论坛中,数澜科技联合创始人&副总裁江敏关于"基于云原生数据仓库AnalyticDB Postgre ...

  5. 小米科技联合创始人兼副总裁黎万强:玩出来的小米品牌

    在"推广与盈利"分论坛上,黎万强带来了主题为<玩出来的小米品牌>的精彩演讲.他和雷军带动小米社区成员参与到小米手机的研发中,通过"玩"手机的各种互动 ...

  6. 观点 | 商汤科技联合创始人林达华:深度学习遭遇瓶颈,未来之路需要新的思考

    观点 | 商汤科技联合创始人林达华:深度学习遭遇瓶颈,未来之路需要新的思考 原创: 商汤科技 商汤SenseTime 今天 日前,由中国计算机学会(CCF).雷锋网.香港中文大学(深圳)联合举办的20 ...

  7. 图麟信息科技联合创始人张勋:全面商用化到来,AI全方面融入行业

    8月30日,由中国高科技行业门户OFweek维科网和高科会主办.OFweek人工智能网承办"2018中国(上海)国际人工智能展览会暨OFweek(第二届)国际人工智能产业大会"在上 ...

  8. 赛灵思宣布收购深鉴科技

    -此交易致力于合力加速数据中心和智能边缘应用 北京与美国加州圣荷塞2018年7月18日电 /美通社/ -- 自适应和智能计算的全球领导企业赛灵思公司(Xilinx, Inc.,(NASDAQ: XLN ...

  9. “她力量”:创邻科技联合创始人吴菁获评创业邦“2022最值得关注的女性创业者”榜单

    3月8日晚,中国创业媒体创业邦发布"2022最值得关注的女性创业者"榜单,创邻科技联合创始人兼COO吴菁女士入选. 后疫情时代,全球数字化加速,产业趋向和经济格局受到深刻影响.数字 ...

最新文章

  1. 生物信息9天速成班—成为团队中不可或缺的人
  2. Sql 某一字段统计
  3. Windows Azure Cloud Service (23) 使用Full IIS模式部署多站点和虚拟目录
  4. Java LinkedList void add(int index,Object o)方法,带示例
  5. java 给字典类型赋值_java使用forEach填充字典值
  6. 27亿美元的NASA「毅力号」成功登陆火星!还带了一架1%大气密度也能飞的无人机...
  7. python卸载pip_python 怎样卸载pip
  8. 五线谱音名和组别对照表_钢琴音区名称及琴键名称对照表
  9. 网站+云服务器+价格表,网站 云服务器 价格表
  10. 计算Sharp夏普率的python和c++代码
  11. 恢复Redis被误删的数据
  12. 物体检测模型RFBNet——一个非常好用的模型。
  13. JQuery实现表单验证并使错误数据其无法提交到数据库
  14. A woman without arms
  15. 巨杉数据库全新认证机制来袭!首期考试时间公布
  16. b560主板怎么样 b560主板支持的cpu
  17. LDO和DCDC电路的概述和区别
  18. [电脑问题]新固态硬盘安装系统以及分区,reboot and select proper boot device的问题处理
  19. 计算机二级c语言改错,2010年计算机二级C语言上机改错题答题总结
  20. iOS 音频播放,录音,视频播放,拍照,视频录制

热门文章

  1. 【AUTOSAR-CanSM】-2.4-参数CanSMBorTimeTxEnsured详解
  2. v-html 解析并插入 html 标签
  3. git.exe 启动 慢_一起绿色出行,2019年“公交出行宣传周”正式启动啦!还有一大波福利正在路上!...
  4. 运用Python看看对于《鹰猎长空》的知乎 vs 豆瓣的战斗
  5. 解决Vmware Workstation环境下CentOs7网络连接激活失败的问题
  6. 【SLAM学习笔记1】欧拉角之万向锁问题(Gimbal Lock)
  7. 【JS】Axios取消未完成请求解决Tab频繁切换数据问题
  8. 2023年6月7日JUC随笔
  9. JAVA .class 文件防止反编译。
  10. 进大厂必看!拼多多大佬总结出来的10万字Springboot经典学习笔记PDF版本,分享给大家!