不同业务往往使用的深度学习库多种多样,例如 Caffe, Tensorflow, Mxnet 等等;

不同业务使用的基础技术差异比较大,有分类识别、检测、分割、语音等等;

不同业务的数据安全级别差异比较大,有些可以公开,有些则需要完全物理隔离;

为了让更多的场景都可以用上我们的服务,获得 AI 的红利,我们提出了一套标准化的量化训练工具。

如上图所示,首先,我们的工具输入支持多种模型格式(TensorFlow,Caffe,Mxnet 等)。其次,我们提供了两种不同的模型量化方法,一种是支持不同任务(分类,检测,分割等)的数据依赖型压缩方法(Data Dependent Compression),适用于对数据安全要求不是很高,希望追求精度最大化的业务;另一种是数据非依赖压缩方法(Data Independent Compression),适用于对数据安全要求高,或者业务逻辑不是特别复杂的场景。

最后,在量化工作完成后,我们的工具会自动完成推理图的优化和模型加密,生成可以实际部署的模型文件。配合对应的推理加速库即可在端上运行。从易用性和数据安全性角度出发,我们推荐使用数据非依赖性的压缩方法。

目前,该套工具作为 MNN 推荐的量化工具广泛应用在阿里集团内多个线下业务场景中。

推理框架

实际中遇到的第二个问题就是真实推理速度问题,毕竟光有易用性是不够的,实打实的业务效果才是业务最想要的。这里我们使用阿里集团其他的兄弟团队提供的推理框架:

ARM 架构: 我们采用淘系技术团队研发的 MNN 作为推理框架;

GPU 架构: 我们采用机器智能技术团队研发的 falcon_conv 卷积库作为推理框架;

FPGA 架构:我们采用服务器研发团队研发的推理框架。

MNN

MNN 是一个轻量级的深度学习端侧推理引擎,核心解决深度神经网络模型在端侧推理运行问题,涵盖深度神经网络模型的优化、转换和推理。目前,MNN 已经在手淘、手猫、优酷、聚划算、UC、飞猪、千牛等 20 多个 App 中使用。选用常见的深度神经网络模型 MobileNet V2 和 SqueezeNet V1.1 作为测试样本:Android 方面,以小米 6 为例,MNN 在 CPU 和 GPU 上领先业界至少 30%;iOS 方面,以 iPhone 7 为例,MNN 在 CPU 和 GPU 上领先业界至少 15%。

FPGA

FPGA 上的推理框架由服务器研发团队完成。ResNet18 网络的推理时间只需要 0.174ms,目前已知业内最佳性能。在边缘计算产品 alibabaedge 上,基于硬件实现的高效算子,推理速度为边缘 GPU 的两倍。在后面,我们会结合产品形态整体的介绍这一方案。

GPU

falcon_conv 是机器智能技术团队开发的一款由 CUDA C++编写,在 Nvidia GPU 上运行的低精度卷积库,它接受 2 份低精度(INT8)张量作为输入,将卷积结果以 float/int32 数据输出,同时支持卷积后一些常规操作(scale,batchnorm,relu… )的合并。我们在单张 Tesla P4 GPU 上,对 falcon_conv 的性能与 Nvidia 官方计算库 Cudnn v7.1 做了比较,如图所示。几乎所有情况 falcon_conv 都优于 Cudnn,个别用例有高至 5 倍的提升,用例选自 RESNET 和 VGG 中耗时较多的卷积参数。

产品化

在业务支持过程中我们遇到的第三个问题是集成化,产品化问题。除了手机类场景外,其他线下业务均需要额外的硬件平台作为支撑。在早先时候,我们更多的是依赖第三方提供的硬件设备,这时候成本,稳定性,可扩展性成为制约线下项目拓展的几个主要问题。为了解决这些问题,我们根据以往的项目经验,对硬件设备进行归纳,沉淀出两类比较通用的线下产品化方案:智能盒子和一体化相机。每类产品均包含不同型号,以适应不同需求的场景。

智能盒子

我们提供的第一个方案为智能盒子方案。我们可以简单的把智能盒子当作一个适合于中小型场景的边缘服务器。盒子本身提供了多种接口,可以外接 usb/ip 相机,语音模块等传感器。直接本地部署,数据安全性高。我们针对业务特点提供了高低两个版本的智能盒子。其中,高端版本采用阿里巴巴自研的边缘计算产品 Alibaba Edge。除了完善的硬件设计和高效的推理框架,该盒子还包含完善的编译器支持,具有非常好的易用性。低端版本则为纯 ARM 的盒子。下面表格给出这两种盒子在性能,成本和适用场景的一个对比。

在这里我们着重介绍一下阿里巴巴自研的边缘计算产品 Alibaba Edge,该产品除了具有高达 3TGFlops 的 AI 计算能力外,相对边缘 GPU 方案有大幅的价格优势,同时具有云端一体化部署功能,产品平台化,可快速上线,支持大规模运维。

在下面的表格中,我们对比了 LRSSD300+MobileNetV2 在不同硬件设备上的运行时间,希望可以给大家一个更直观的认识。

一体化相机

我们提供的另一个集成方案为一体化相机。一体化相机特别适合云+端的部署模式:线下做相对比较简单的处理功能,云端则深度处理线下传回的信息,达到节约带宽,降低云成本的作用。同时,一体化相机具有方便部署,批量化生产后成本优势高的特点。目前一体化相机已经作为一个重要的载体形式被应用到我们所承接的对集团外合作项目中。

业务合作

在过去的 2 年间,我们尝试过多种不同的业务模式。在这里我们会列出主要几个不同形式的实例。

菜鸟未来园区

在菜鸟未来园区项目中,我们主要负责基础视觉类算法的输出,由菜鸟智慧园区团队同学负责业务算法和工程服务研发工作。经过半年的共同努力,我们先后完成了离岗睡岗检测,消防通道异常检测,车位占用检测,行人越界检测,入口计数检测等多个功能。

在项目合作的过程中,我们发现计算单元成本高是制约算法大范围推广的一个主要原因。为了解决这个问题,我们联合了服务器研发团队,开发出一版定制化软硬件解决方案:该方案的硬件平台为我们在上文中提到的边缘计算产品 Alibaba Edge,同时配备特别定制的高效模型结构和自研的快速检测算法。新版方案在检测精度几乎无损的情况下,推理速度提升了 4-5 倍,成本相比边缘 GPU 方案下降了 1/2。

模型压缩加速

我们协助阿里集团不同业务同学完成对已有算法模型的量化瘦身与加速工作。例如:手机端 OCR 识别、手机端物体检测、手淘实人认证和刷脸登录/验证、菜鸟自提柜、阿里体育赛事刷脸入场、神州鹰人脸识别云相册等。

总结与展望

经过近两年的努力,机器智能技术实验室线下智能团队深耕线下智能领域。

算法方面:我们在低比特量化、稀疏化、软硬件协同设计、轻量级网络设计、端上目标检测等多个方面取得了一定的积累,多项指标达到了业内最佳水平。

工程方面:我们积累出了一套高灵活性,高数据安全性的训练工具 ; 并在合作伙伴的帮助下,在 ARM,FPGA,GPU 等多个平台下达到了业内最佳的推理性能。

产品化方面:我们与合作伙伴一起,研发出适合于不同业务场景的智能盒子与一体化相机。

最后,我们很幸运可以在集团内外多个不同形式的业务场景内打磨我们的技术。

智能实验室服务器,阿里巴巴机器智能实验室线下智能团队三年工作总结相关推荐

  1. 首次披露!阿里线下智能方案进化史

    阿里妹导读:AI 技术已经从互联网走向零售.汽车.银行等传统行业.受限于延时.成本.安全等多方面的限制,单一的云解决方案往往不能满足场景需求.线下智能方案逐步成为了智能化过程中重要的一环,今天,我们就 ...

  2. 全国大学生智能汽车竞赛-讯飞赛道线下赛开始报名啦!

    五月将至,迅飞赛道线下赛等你! 01 赛事介绍 「全 国大学生智能汽车竞赛 」是教育部倡导的大学生科技A类竞赛,中国高等教育学会将其列为含金量最高的大学生竞赛之一.比赛每年吸引了包括清华.上交.复旦. ...

  3. 智能路由器市场份额增长态势不减 线下渠道或将成为下一个爆发点

    随着智能手机市场规模不断的扩大,智能路由器成为商家开发的另一新领域,目前线上路由器市场份额遥遥领先线下市场,已形成对峙局面,未来智能路由器的线下渠道将成为路由器厂商主要的发力点.本次iiMedia R ...

  4. 七星创客新零售模式,快速从线上到线下裂变团队

    七星创客是艾倍生平台的新零售模式,该模式运营短短几个月就为艾倍生创下辉煌的销售业绩,其盈利能力不可小觑,是互联网时代下的又一新风口.在这个互联网飞速发展的时代,任何一个微不足道的模式都可能是千里马,唯 ...

  5. 【长期社招】【校招】阿里巴巴机器智能实验室(原idst)深度学习团队长期招聘

    对于社招长期招聘P6~P7同学,对于校招要求是应届毕业生.团队积累了很厚实的技术能力以及前瞻性的算法研究基础.我们希望能够继续吸引到深度学习这方面的出色的人才加盟,能够负责深度学习最先进的技术研究和工 ...

  6. 从仿真到实飞,Prometheus自主无人机开发全覆盖!快来参加阿木实验室线下集训吧!

    受够了假期的人挤人吗?快来参加阿木实验室线下集训吧! 阿木在此重磅推出"国庆特训营 "!本次特训由Prometheus项目创始人主讲,手把手授课!五天时间带你入门无人机科研圈,让你 ...

  7. 从线上卖到线下,秘籍在这里|千牛头条双11直播

    自从2016年的云栖大会上,马云提出了"新零售"概念后,一年来,小编掐指一算,从盒马.无人售货店到零售通.天猫小店,在阿里巴巴这个主阵地上,已经涌现了这么多新的生态和样本,感觉自己 ...

  8. AAA的线下保护以及路由器使用ACS认证登录

    AAA的线下保护以及路由器使用ACS认证登录 本篇重点讲解一下AAA的线下保护,防止我们在开启AAA服务的时候本地的用户登录被洗掉,再讲一下如何使用acs认证登录,用来体现数据包的加密.@[TOC] ...

  9. 水滴公司再回应“线下违规”:核心是公司的管理问题

    近日,有媒体报道称,水滴筹地推疑被下达了指标规定,被指存在地毯式扫楼拉单.随意填写募捐金额.有意隐瞒求助者财产状况等行为. 针对此事,水滴公司再发声明称,公司第一时间成立工作组展开相应调查,并且全面暂 ...

最新文章

  1. centos环境自动化批量安装软件脚本
  2. H5跟ios、android交互跟数据对接
  3. DirectX11 driver类型浅析
  4. 超图桌面开发VC++ 入门程序
  5. Redhat 6.4_联网 yum 配置
  6. 每天一道LeetCode-----计算给定序列中所有长度为k的滑动窗的最大值集合
  7. 【Azure Show】|第七期 特别版线上沙龙直播回顾. 嘉宾张坤段清华谭国欣柯克黄炜锵...
  8. 隔年增长的题_资料分析——隔年增长
  9. vue+axios+qs序列化 “三步解析”【含demo实例】- 代码篇
  10. jq获取页面高度_JQuery获取页面高度宽度
  11. runtime之ivar内存布局篇
  12. 心力哲学——艰难多变环境下快乐、自由与生存力的源泉(二)
  13. Windows环境下 .Net PetaPoco 配置 Mysql
  14. 微信抢抢票服务器,已有多人被坑!抢票“加速包”慎用!
  15. Centos 7系统常用指令
  16. 虚幻引擎学习笔记——Month1 Week2
  17. 安卓手机调试微信网页, 真机调试模式开启
  18. Hadoop学习——Hadoop概述
  19. 88是python语言的整数类型_少儿Python编程_第三讲:常量变量和数据类型
  20. Hello Riak

热门文章

  1. 又发现一款牛逼的 API 敏捷开发工具
  2. 如何区分普通感冒流感和新型冠状病毒肺炎?
  3. 架构师,是否需要写代码?
  4. MAVEN自定义项目骨架
  5. jeecg 3.5.2 新版本4种首页风格 【经典风格,shortcut风格,ACE bootstrap风格,云桌面风格】
  6. tomcat 软连接问题
  7. Linux环境编程导引
  8. WebView 文档 翻译
  9. CDN缓存服务器现状
  10. SCCM 2012 R2---安装客户端代理软件