阿里开源MNNKit：基于MNN的移动端深度学习SDK，支持安卓和iOS

2020-01-23 09:07:03

机器之心报道

参与：一鸣、Jamin

近来，有越来越多的深度学习框架开始面向移动端进行发展。近日，阿里也基于其 MNN 推理引擎开源了最新的 MNNKit 深度学习 SDK，安卓和 iOS 开发者都可以方便地进行调用。

近年来，很多企业都在研发面向移动端的深度学习框架。在国内有小米的 Mace、腾讯的 FeatherCNN（腾讯 AI）和 ncnn（腾讯优图）、百度的 Paddle-moblie 等。而阿里也开发了自己的移动端深度学习框架 MNN。
近日，阿里开源了基于 MNN 引擎的项目 MNNKit，面向安卓和 iOS，以 SDK 的方式提供 AI 端侧推理能力。开发者不需要了解算法细节就可以直接使用。
项目地址：https://github.com/alibaba/MNNKit
目前，MNNKit 已经有人脸检测、手势识别、人像分割等，后续可能有更多 API 接入。
MNNKit：基于 MNN 的深度学习工具
MNN 是基于阿里的 MNN 端上推理引擎所开发的应用解决方案，主要面向安卓和 iOS 系统，帮助将 AI 能力应用在实际的移动端场景中。
MNNKit 架构
MNNKit 提供了一个 SDK 供开发者使用，以下为 SDK 的架构。

从图中可以看出，MNNKit 可以分为三层结构，从底向上分别为：

MNN 引擎层，是 MNN (https://github.com/alibaba/MNN) 库在 Android/iOS 上编译好的包的二进制 Release 版本，提供端侧运行环境。
Core 基础层，这主要抽象和封装与 MNN c++接口调用粒度基本一致的上层 API，iOS 通过 OC 接口提供，Android 通过 Java 接口提供（TODO）。这一层同时也为上层 SDK 提供一些公共服务类或结构定义。
业务 Kit 层，包括了人脸检测、手势识别封装的 API。据项目介绍，之后的业务 Kit 层会不断扩展。

内部原理
因为 MNNKit 主要提供阿里的端侧 AI 能力，因此封装了很多相关应用的 API。调用如下：

例如，当用户需要调用 API 的时候，需要首先创建实例，然后将图像、视频或其他结构化数据输入，进行 AI 模型的推理工作。工作完成后释放实例即可。
目前 MNNKit 已支持的 API 有：

人脸检测 API
手势识别 API
人像分割 API

以人脸检测为例，检测内容主要分为三大板块：

人脸基本信息

人脸位置的矩形坐标
106 个关键点坐标（区分被遮挡的和未被遮挡的）
置信度

106 个关键点的分布（来自官方开源 github）

人脸各区域关键点分布对应表

欧拉角度

摇头（Yaw）、点头（Pitch）、歪头（Roll）三个角度值

人脸动作（包含 5 个人脸的动作）

眨眼
张嘴
摇头
点头
扬眉

处理过程
我们知道了人脸检测需要检测的数据后，接下来看看处理过程：

如图所示，该流程是 iOS 和安卓设备后置摄像头正向拍摄后，在移动端上的整体处理过程。
首先，系统从摄像头获取数据，作为 SDK 的输入。接着，SDK 会进行如下操作：

在 MNN 引擎执行推理之前，对原始的输入进行预处理，保证输入数据中的人脸为正向
使用 AI 模型进行推理；
推理后，产生基于输入图像（预处理之后的）坐标系的关键点结果；。
把关键点坐标变换到和屏幕渲染坐标系相同的方向，方便渲染。

程应用中，最后的结果关键点要显示在用户屏幕上，前端会使用一个用来渲染的"画布"。画布的坐标系被称为渲染坐标系，
在 SDK 检测的最后一步，我们将关键点变换到和渲染坐标系相同的方向，然后等比例映射关键点坐标到渲染坐标系的坐标即可。映射后可以直接渲染到画布上
代码示例
MNNKit 提供了包括人脸检测、手势识别等方面的示例代码。接下来我们以人脸检测为例，看看怎样可以在安卓或 iOS 中调用 API 进行推理工作。
安卓代码
前文提到，调用 API 需要首先创建一个实例，以下为异步创建 FaceDetector 实例，主线程中回调的代码。

publicstaticvoidcreateInstanceAsync(Contextcontext,FaceDetectorCreateConfigcreateConfig,InstanceCreatedListener<FaceDetector>listener)

在这里，人脸检测 API 会进行检测和跟踪两个动作。检测会遭到人脸位置和关键点，而跟踪是在人脸移动时重新定位关键点的位置。
在视频模式下，系统默认每 20 帧检测一次，其余帧只跟踪。图片模式下则每一次调用都检测。
创建实例后，可以将数据输入模型进行推理。MNNKit 现在已支持多种数据格式输入。在视频流检测场景中，我们可以使用摄像头的回调数据作为接口的输入。输入数据的代码如下：

publicsynchronizedFaceDetectionReport[]inference(byte[]data,intwidth,intheight,MNNCVImageFormatformat,longdetectConfig,intinAngle,intoutAngle,MNNFlipTypeoutputFlip)

使用输入数据为 bitmap 的推理代码如下：

publicsynchronizedFaceDetectionReport[]inference(Bitmapbitmap,longdetectConfig,intinAngle,intoutAngle,MNNFlipTypeoutputFlip)

当 FaceDetector 实例用完之后，我们需要手动释放实例，否则会产生 native 的内存泄露。

publicsynchronizedvoidrelease()

iOS 代码
和安卓代码类似，首先需要创建人脸检测实例：

+(void)createInstanceAsync:(MNNFaceDetectorCreateConfig*)configCallback:(void(^)(NSError*error,MNNFaceDetector*faceDetector))blockCallbackQueue:(dispatch_queue_t)callbackQueue;

默认主线程回调：

+(void)createInstanceAsync:(MNNFaceDetectorCreateConfig*)configCallback:(void(^)(NSError*error,MNNFaceDetector*faceDetector))block;

PixelBuffer 输入进行推理的代码如下：

-(NSArray<MNNFaceDetectionReport*>*)inference:(CVPixelBufferRef)pixelBufferConfig:(MNNFaceDetectConfig)detectConfigAngle:(float)inAngleOutAngle:(float)outAngleFlipType:(MNNFlipType)flipTypeerror:(NSError*__autoreleasing*)error;

UIImage 输入进行推理的代码如下：

-(NSArray<MNNFaceDetectionReport*>*)inferenceImage:(UIImage*)imageConfig:(MNNFaceDetectConfig)detectConfigAngle:(float)inAngleOutAngle:(float)outAngleFlipType:(MNNFlipType)flipTypeerror:(NSError*__autoreleasing*)error;

使用通用 buffer 数组输入的代码如下：

-(NSArray<MNNFaceDetectionReport*>*)inference:(unsignedchar*)dataWidth:(float)wHeight:(float)hFormat:(MNNCVImageFormat)formatConfig:(MNNFaceDetectConfig)detectConfigAngle:(float)inAngleOutAngle:(float)outAngleFlipType:(MNNFlipType)flipTypeerror:(NSError*__autoreleasing*)error;

实例生命周期结束后，会自动触发相关内存的释放，无需调用方手动释放。
据悉，MNNKit 是 MNN 团队在阿里系应用大规模业务实践后的成熟解决方案，历经双十一等项目考验，在不依赖于后端的情况下进行高性能推理，使用起来稳定方便。

阿里开源MNNKit：基于MNN的移动端深度学习SDK，支持安卓和iOS相关推荐

阿里巴巴重磅开源MNNKit：基于MNN的移动端深度学习SDK，支持安卓和iOS
机器之心报点击上方"开发者技术前线",选择"星标" 13:21 在看|留言|真爱来自:机器之心参与:一鸣.Jamin 近来,有越来越多的深度学习框架开 ...
小米开源移动端深度学习框架MACE，自主研发，专为IoT设备优化
允中发自凹非寺量子位报道 | 公众号 QbitAI 这可能是小米目前为止最重要的AI大动作. 昨天(6月28日),在2018开源中国开源世界高峰论坛现场,小米人工智能与云平台副总裁崔宝秋对外 ...
小米开源自研移动端深度学习框架MACE
小米人工智能与云平台副总裁崔宝秋博士在开源中国开源世界高峰论坛上发表<小米 AI 时代的开源>演讲,并在会上宣布,开源小米自研的移动端深度学习框架 Mobile AI Compute En ...
大数据早报：百度开源移动端深度学习框架中国联通成立大数据公司（9.26）
数据早知道,上36dsj看早报! 来源36大数据,作者:奥兰多『深度学习』百度开源移动端深度学习框架mobile-deep-learning 2017 年 9 月 25 日,百度在 GitHub 开 ...
移动端深度学习开源框架及部署
TensorFlow Lite 开源企业:谷歌 GitHub地址:https://github.com/tensorflow/tflite-micro TensorFlow Lite for Micr ...
雅虎开源CaffeOnSpark：基于Hadoop/Spark的分布式深度学习
雅虎开源CaffeOnSpark:基于Hadoop/Spark的分布式深度学习 [日期:2016-02-26] 来源:极客头条作者: [字体:大中小] 在基于Hadoop集群的大规模分布式深度学 ...
支持移动端深度学习的几种开源框架
原文:http://blog.csdn.net/zchang81/article/details/74280019 支持移动端深度学习的几种开源框架 1.Caffe的移动端项目 caffe项目连接如下 ...
基于端到端深度学习的自动驾驶：AirSim教程（包含Ubuntu18.04下配置AIrsim仿真环境解决方案）
这是微软自动驾驶食谱的第一个教程(目前共两个).之前看到过,这里记录一下. https://github.com/microsoft/AutonomousDrivingCookbook 前言在本教程 ...
【移动端DL框架】当前主流的移动端深度学习框架一览
大家好,继之前的12大深度学习开源框架之后,我们准备开通新的专栏<移动端DL框架>,这是第一篇文章,先来做一个总体的介绍,更多的细节可以关注以后的文章. 在这个专栏中,我们会介绍与移动端的 ...

阿里开源MNNKit：基于MNN的移动端深度学习SDK，支持安卓和iOS

阿里开源MNNKit：基于MNN的移动端深度学习SDK，支持安卓和iOS相关推荐

最新文章

热门文章