小米人工智能与云平台副总裁崔宝秋博士在开源中国开源世界高峰论坛上发表《小米 AI 时代的开源》演讲,并在会上宣布,开源小米自研的移动端深度学习框架 Mobile AI Compute Engine (MACE)。

6 月 28 日,小米人工智能与云平台副总裁崔宝秋博士在开源中国开源世界高峰论坛上发表《小米 AI 时代的开源》演讲,并在会上宣布,开源小米自研的移动端深度学习框架 Mobile AI Compute Engine (MACE)。

地址:https://github.com/XiaoMi/mace

近年来,随着移动互联网的深入发展和 IoT 智能设备的普及,以及用户对智能性,低延迟和隐私保护的诉求变得越来越高,移动设备上的离线深度学习应用变得越来越普遍。

据雷锋网了解,MACE 是专门为移动设备优化的深度学习模型预测框架,MACE 从设计之初,便针对移动设备的特点进行了专门的优化:

  • 速度:对于放在移动端进行计算的模型,一般对整体的预测延迟有着非常高的要求。在框架底层,针对 ARM CPU 进行了 NEON 指令级优化,针对移动端 GPU,实现了高效的 OpenCL 内核代码。针对高通 DSP,集成了 nnlib 计算库进行 HVX 加速。同时在算法层面,采用 Winograd 算法对卷积进行加速。

  • 功耗:移动端对功耗非常敏感,框架针对 ARM 处理器的 big.LITTLE 架构,提供了高性能,低功耗等多种组合配置。针对 Adreno GPU,提供了不同的功耗性能选项,使得开发者能够对性能和功耗进行灵活的调整。

  • 系统响应:对于 GPU 计算模式,框架底层对 OpenCL 内核自适应的进行分拆调度,保证 GPU 渲染任务能够更好的进行抢占调度,从而保证系统的流畅度。

  • 初始化延迟:在实际项目中,初始化时间对用户体验至关重要,框架对此进行了针对性的优化。

  • 内存占用:通过对模型的算子进行依赖分析,引入内存复用技术,大大减少了内存的占用。

  • 模型保护:对于移动端模型,知识产权的保护往往非常重要,MACE 支持将模型转换成 C++ 代码,大大提高了逆向工程的难度。

此外,据了解,MACE 支持 TensorFlow 和 Caffe 模型,提供转换工具,可以将训练好的模型转换成专有的模型数据文件,同时还可以选择将模型转换成 C++ 代码,支持生成动态库或者静态库,提高模型保密性。

目前 MACE 已经在小米手机上的多个应用场景得到了应用,其中包括相机的人像模式,场景识别,图像超分辨率,离线翻译(即将实现)等。

此外,随着 MACE 一起开源的还有 MACE Model Zoo 项目,目前包含物体识别,场景语义分割,图像风格化等多个公开模型。后续会增加更多模型。

上方是用 MACE Model Zoo 中的 fast style transfer(快速风格迁移)模型在手机端生成的风格化图片。

据雷锋网了解,此前小米曾参与多个国际重大的开源项目,比如 Hadoop,HBase,Spark,TensorFlow 等,同时,小米也积极参与自研、具有通用性的软件系统。过去几年,小米相继推出了 Linden(分布式实时搜索系统),Open-Falcon(互联网企业级监控系统)、Pegasus(分布式 KV 存储系统)等一系列开源项目。

在 AI 方面,小米开源了自研的针对移动端设备优化的深度学习框架 MACE,目前已经支持内部的多个业务。

另外,6 月 29 日至 7 月 2 日雷锋网将在深圳举办 CCF-GAIR 大会,小米首席架构师、小米人工智能与云平台副总裁崔宝秋将作为嘉宾出席并发表演讲。

全球人工智能与机器人峰会(CCF-GAIR) 由中国计算机学会(CCF)主办,雷锋网、香港中文大学(深圳)承办,得到了深圳市政府的大力指导,是国内人工智能和机器人学术界、工业界及投资界三大领域的顶级交流盛会,旨在打造国内人工智能领域最具实力的跨界交流合作平台。

CCF-GAIR 2018 延续前两届的“顶尖”阵容,提供 1 个主会场和 11 个专场(仿生机器人专场,机器人行业应用专场,计算机视觉专场,智能安全专场,金融科技专场,智能驾驶专场,NLP 专场,AI+ 专场,AI 芯片专场,IoT 专场,投资人专场)的丰富平台,意欲给三界参会者从产学研多个维度,呈现出更富前瞻性与落地性相结合的会议内容与现场体验。

小米开源自研移动端深度学习框架MACE相关推荐

  1. 小米开源移动端深度学习框架MACE,自主研发,专为IoT设备优化

    允中 发自 凹非寺  量子位 报道 | 公众号 QbitAI 这可能是小米目前为止最重要的AI大动作. 昨天(6月28日),在2018开源中国开源世界高峰论坛现场,小米人工智能与云平台副总裁崔宝秋对外 ...

  2. 比拼三大移动端深度学习框架,小米MACE有哪些优势?

    采访嘉宾 | 何亮亮 AI前线导读: 随着深度学习领域的快速发展,以及移动端芯片计算能力的逐步提升,设备端上的深度学习推理正在变成一个巨大的需求和趋势,一个好用的深度学习框架成为深度学习应用落地的关键 ...

  3. AI开发者看过来,主流移动端深度学习框架大盘点

    简书作者 dangbo 在<移动端深度学习展望>一文中对现阶段的移动端深度学习做了相关展望.作者认为,现阶段的移动端 APP 主要通过以下两种模式来使用深度学习: online 方式:移动 ...

  4. 移动端深度学习框架——绝影简介

    绝影(Prestissimo) 绝影是九言科技开发的高性能移动端深度学习框架,其项目地址见 https://github.com/in66-dev/In-Prestissimo 背景 绝影前身是一个G ...

  5. 大数据早报:百度开源移动端深度学习框架 中国联通成立大数据公司(9.26)

    数据早知道,上36dsj看早报! 来源36大数据,作者:奥兰多 『深度学习』百度开源移动端深度学习框架mobile-deep-learning 2017 年 9 月 25 日,百度在 GitHub 开 ...

  6. 【移动端DL框架】当前主流的移动端深度学习框架一览

    大家好,继之前的12大深度学习开源框架之后,我们准备开通新的专栏<移动端DL框架>,这是第一篇文章,先来做一个总体的介绍,更多的细节可以关注以后的文章. 在这个专栏中,我们会介绍与移动端的 ...

  7. 主流部署端深度学习框架

    文章目录 NCNN 同框架对比 支持卷积神经网络,多输入和多分支 无任何第三方库依赖 纯 C++ 实现,跨平台 汇编级优化,计算速度极快 MNN 模型 优势 通用性 轻量性 高性能 易用性 性能测评 ...

  8. 一码跑遍众多小程序,饿了么开源自研多端框架 MorJS

    作者 | MorJS 技术团队 出品 | 阿里巴巴终端技术 Mor (发音为 /mɔːr/,类似 more) 是饿了么开发的一款基于小程序 DSL 的,可扩展的多端研发框架. 使用 MorJS,我们只 ...

  9. TensorFlow Lite 正式发布,谷歌移动端深度学习框架

    今年 5 月,谷歌曾在 I/O 大会上宣布即将推出 TensorFlow Lite,现在,谷歌终于发布了新工具的开发者预览版本,这是一款 TensorFlow 用于移动设备和嵌入式设备的轻量级解决方案 ...

最新文章

  1. Mysql 宕机引发索引丢失很可怕,文件 IO 中如何保证掉电不丢失数据?
  2. linux grub设置cpu频率,Linux:使用性能调控器时,为什么CPU频率会发生波动?
  3. 如何做到免驱打印_道滘镇彩色打印机租赁公司,长安镇办公室绿植安装
  4. 测试:abstract class不允许出现在Angular依赖注入框架的providers区域内
  5. Alsa中PCM参数设置
  6. java 线性表的表示和实现_线性表中顺序表的的理解和实现(java)
  7. Linux升级内核的正确姿势
  8. etherum 常用命令及搭建私有链
  9. (数据库系统概论|王珊)第六章关系数据理论-第一节:为什么要研究关系数据理论
  10. 湖南科技大学计算机学院宿舍,湖南科技大学计算机科学与工程学院
  11. Java-线程-创建线程的方法
  12. SVN工作副本已经锁定错误的解决方法
  13. python随机选人程序_python: 随机选择
  14. Scrum立会报告+燃尽图(十月二十六日总第十七次)
  15. dos系统的界面字体设置
  16. S3C6410(OK6410开发板介绍)
  17. 阿里云相关-云服务器ECS
  18. 服务器多开系统,服务器多开虚拟机操作系统
  19. PTA_数据结构与算法_7-7 六度空间 (30分)
  20. 解决ssh: Could not resolve hostname ***: nodename nor servname provided, or not known报错

热门文章

  1. 基于51单片机的音乐盒设计
  2. 还在为寻找高质量3D素材发愁?数字资产库 #PBRMAX 快来体验!
  3. 使用Yearning部署一个工单化SQL语句检测平台
  4. 谈谈 CSS 关键字 initial、inherit 和 unset
  5. js实现全屏,退出全屏功能
  6. 现在很多公司为什么热衷于招内部推荐的人呢
  7. 葛洲坝电力集团责任有限公司启动时代新领域核心
  8. 深入学习jquery源码之addClass()和toggleClass()与hasClass()
  9. sourcetree交互式变基
  10. 基于ASP.NET的动漫管理系统设计与实现