详细见MNN官方文档


习惯于Opencv对数据进行预处理,见官方文档中没有涉及Opencv,便抽时间写下此篇.
本文采用caffe训练的分类模型,数据格式为NCHW, 图像格式为BGR.
为了使文章完整,本文绝大多数文字记录部分摘自(PS: 复制\粘贴)MNN官方文档


文章目录

  • 一、创建会话
  • 二、使用Opencv进行预处理
  • 三、输入数据
  • 四、运行会话,执行推理
  • 五、获取输出
  • 六、完整代码

MNN推理主要由以下四个部分组成

一、创建会话

MNN创建会话(Session)主要通过 解释器(Interpreter)创建会话(Session).
使用MNN推理时,有两个层级的抽象,分别是解释器Interpreter和会话Session。Interpreter是模型数据的持有者;Session通过Interpreter创建,是推理数据的持有者。多个推理可以共用同一个模型,即,多个Session可以共用一个Interpreter
函数返回的Session实例是由Interpreter管理,随着Interpreter销毁而释放,一般不需要关注。也可以在不再需要时,调用Interpreter::releaseSession释放,减少内存占用。

const char *pchPath = ".models/DogVsCat.mnn";
/*interpreter 解释器,是模型数据的持有者,我称之为net* session 会话,是推理数据的持有者,session通过interpreter创建,多个session可以公用一个interpreter* session 和TF的session类似* 我们需要通过net创建session1、session2等会话,然后再给session里送入数据,* 创建Session 一般而言需要较长耗时,而Session 在多次推理过程中可以重复使用,建议只创建一次多次使用* 最后通过net->runSession(session1)执行推理*/std::shared_ptr<Interpreter> net(Interpreter::createFromFile(pchPath));// 创建sessionScheduleConfig config;config.type  = MNN_FORWARD_AUTO;Session *pSession = net->createSession(config);// 获取输入Tensor// getSessionInput 用于获取单个输入tensorTensor *ptensorInput = net->getSessionInput(pSession, NULL);std::vector<int> vctInputDims = ptensorInput->shape();printf("输入Tensor的维度为: ");for (size_t i = 0; i < vctInputDims.size(); ++i){printf("%d ", vctInputDims[i]);}printf("\n");

二、使用Opencv进行预处理

数据预处理一般步骤为:

  • 1、缩放: 本文缩放到224*224
  • 2、减均值、除方差
cv::Mat matBgrImg = cv::imread("/home/hjxu/test.bmp");
cv::Mat matNormImage;
cv::Mat matRzRgbImage, matFloatImage;
int MODEL_INPUT_HEIGHT = 224;
int MODEL_INPUT_WIDTH = 224;
cv::Mat matStd(MODEL_INPUT_HEIGHT, MODEL_INPUT_WIDTH, CV_32FC3, cv::Scalar(255.0f, 255.0f, 255.0f));
cv::resize(matBgrImg, matRzRgbImage, cv::Size(MODEL_INPUT_WIDTH, MODEL_INPUT_HEIGHT));
matRzRgbImage.convertTo(matFloatImage, CV_32FC3);
cv::Mat matMean(MODEL_INPUT_HEIGHT, MODEL_INPUT_WIDTH, CV_32FC3, \cv::Scalar(103.53f, 116.28f, 123.675f)); // 均值matNormImage = (matFloatImage - matMean) / matStd;
  • 3、opencv读取的图像是NHWC的,本文还需要转换成NCHW
std::vector<std::vector<cv::Mat>> nChannels;
std::vector<cv::Mat> rgbChannels(3);
cv::split(matNormImage, rgbChannels);
nChannels.push_back(rgbChannels); //  NHWC  转NCHW
void *pvData = malloc(1 * 3 * MODEL_INPUT_HEIGHT * MODEL_INPUT_WIDTH *sizeof(float));
int nPlaneSize = MODEL_INPUT_HEIGHT * MODEL_INPUT_WIDTH;
for (int c = 0; c < 3; ++c)
{cv::Mat matPlane = nChannels[0][c];memcpy((float *)(pvData) + c * nPlaneSize,\matPlane.data, nPlaneSize * sizeof(float));
}

三、输入数据

Interpreter上提供了两个用于获取输入Tensor的方法:getSessionInput用于获取单个输入tensor,
getSessionInputAll用于获取输入tensor映射。
在只有一个输入tensor时,可以在调用getSessionInput时传入NULL以获取tensor。

这里采用最简洁的输入方式,直接利用host填充数据,但这种方式仅限于CPU后端,其他后端还是需要通过deviceid输入。此外,用这种方式填充数据需要我们自行处理NCHW或者NHWC的数据格式
本文这里,已经将NHWC转成了NCHW了,即 pvData

auto nchwTensor = new Tensor(ptensorInput, Tensor::CAFFE);
::memcpy(nchwTensor->host<float>(), pvData, nPlaneSize * 3 * sizeof(float));
ptensorInput->copyFromHostTensor(nchwTensor);
delete nchwTensor;

四、运行会话,执行推理

MNN中,Interpreter一共提供了三个接口用于运行Session,但一般来说,简易运行就足够满足绝对部分场景。
这里也只介绍简易运行,想了解更复杂的,见官方文档
直接调用 runSession函数

net->runSession(pSession);

五、获取输出

Interpreter上提供了两个用于获取输出Tensor的方法:getSessionOutput用于获取单个输出tensor,
getSessionOutputAll用于获取输出tensor映射。
在只有一个输出tensor时,可以在调用getSessionOutput时传入NULL以获取tensor。

Tensor *pTensorOutput = net->getSessionOutput(pSession, NULL);
// 获取输出维度类型
auto dimType = pTensorOutput->getDimensionType();
if (pTensorOutput->getType().code != halide_type_float) {dimType = Tensor::CAFFE;
}
// 创建输出tensor
std::shared_ptr<Tensor> outputUser(new Tensor(pTensorOutput, dimType));
MNN_PRINT("output size:%d\n", outputUser->elementSize());
// 拷贝出去
pTensorOutput->copyToHostTensor(outputUser.get());
auto type = outputUser->getType();auto size = outputUser->elementSize();
std::vector<std::pair<int, float>> tempValues(size);
if (type.code == halide_type_float) {auto values = outputUser->host<float>();for (int i = 0; i < size; ++i) {tempValues[i] = std::make_pair(i, values[i]);}
}
// Find Max
// 排序, 打印
std::sort(tempValues.begin(), tempValues.end(),[](std::pair<int, float> a, std::pair<int, float> b) { return a.second > b.second; });int length = size > 10 ? 10 : size;
for (int i = 0; i < length; ++i) {MNN_PRINT("%d, %f\n", tempValues[i].first, tempValues[i].second);
}

六、完整代码

//
// Created by hjxu on 2021/2/2.
//#include <iostream>
#include <MNN/Interpreter.hpp>using namespace MNN;#include "opencv2/opencv.hpp"
int main()
{const char *pchPath = "./models/DogVsCat.mnn";/*interpreter 解释器,是模型数据的持有者,我称之为net* session 会话,是推理数据的持有者,session通过interpreter创建,多个session可以公用一个interpreter* session 和TF的session类似* 我们需要通过net创建session1、session2等会话,然后再给session里送入数据,* 最后通过net->runSession(session)执行推理*/std::shared_ptr<Interpreter> net(Interpreter::createFromFile(pchPath));// 创建sessionScheduleConfig config;config.type  = MNN_FORWARD_AUTO;Session *pSession = net->createSession(config);// 获取输入Tensor// getSessionInput 用于获取单个输入tensorTensor *ptensorInput = net->getSessionInput(pSession, NULL);std::vector<int> vctInputDims = ptensorInput->shape();printf("输入Tensor的维度为: ");for (size_t i = 0; i < vctInputDims.size(); ++i){printf("%d ", vctInputDims[i]);}printf("\n");
//    shape[0]   = 1;// 重建Tensor的形状,我们这里输入的固定的224*224, 所以可以不需要resize
//    net->resizeTensor(tensorInput, vctInputShape);
//    net->resizeSession(pSession);// opencv 读取数据,resize操作,减均值, 除方差,并且转成nchwcv::Mat matBgrImg = cv::imread("./test.bmp");cv::Mat matNormImage;cv::Mat matRzRgbImage, matFloatImage;int MODEL_INPUT_HEIGHT = 224;int MODEL_INPUT_WIDTH = 224;cv::Mat matStd(MODEL_INPUT_HEIGHT, MODEL_INPUT_WIDTH, CV_32FC3, cv::Scalar(255.0f, 255.0f, 255.0f));cv::resize(matBgrImg, matRzRgbImage, cv::Size(MODEL_INPUT_WIDTH, MODEL_INPUT_HEIGHT));matRzRgbImage.convertTo(matFloatImage, CV_32FC3);cv::Mat matMean(MODEL_INPUT_HEIGHT, MODEL_INPUT_WIDTH, CV_32FC3, \cv::Scalar(103.53f, 116.28f, 123.675f)); // 均值matNormImage = (matFloatImage - matMean) / matStd;std::vector<std::vector<cv::Mat>> nChannels;std::vector<cv::Mat> rgbChannels(3);cv::split(matNormImage, rgbChannels);nChannels.push_back(rgbChannels); //  NHWC  转NCHWvoid *pvData = malloc(1 * 3 * MODEL_INPUT_HEIGHT * MODEL_INPUT_WIDTH *sizeof(float));int nPlaneSize = MODEL_INPUT_HEIGHT * MODEL_INPUT_WIDTH;for (int c = 0; c < 3; ++c){cv::Mat matPlane = nChannels[0][c];memcpy((float *)(pvData) + c * nPlaneSize,\matPlane.data, nPlaneSize * sizeof(float));}// 将数据拷贝到Tensor中// 这里采用最简洁的输入方式,直接利用host填充数据,但这种方式仅限于CPU后端,其他后端// 还是需要通过deviceid输入。此外,用这种方式填充数据需要我们自行处理NCHW或者NHWC的数据格式// 本文这里,已经将NHWC转成了NCHW了,即 pvData
//    std::shared_ptr<MNN::CV::ImageProcess> pretreat_data_ = nullptr;auto nchwTensor = new Tensor(ptensorInput, Tensor::CAFFE);::memcpy(nchwTensor->host<float>(), pvData, nPlaneSize * 3 * sizeof(float));ptensorInput->copyFromHostTensor(nchwTensor);delete nchwTensor;// 获取输出TensorTensor *pTensorOutput = net->getSessionOutput(pSession, NULL);// 执行推理net->runSession(pSession);{// 获取输出维度类型auto dimType = pTensorOutput->getDimensionType();if (pTensorOutput->getType().code != halide_type_float) {dimType = Tensor::CAFFE;}// 创建输出tensorstd::shared_ptr<Tensor> outputUser(new Tensor(pTensorOutput, dimType));MNN_PRINT("output size:%d\n", outputUser->elementSize());// 拷贝出去pTensorOutput->copyToHostTensor(outputUser.get());auto type = outputUser->getType();auto size = outputUser->elementSize();std::vector<std::pair<int, float>> tempValues(size);if (type.code == halide_type_float) {auto values = outputUser->host<float>();for (int i = 0; i < size; ++i) {tempValues[i] = std::make_pair(i, values[i]);}}// Find Max// 排序, 打印std::sort(tempValues.begin(), tempValues.end(),[](std::pair<int, float> a, std::pair<int, float> b) { return a.second > b.second; });int length = size > 10 ? 10 : size;for (int i = 0; i < length; ++i) {MNN_PRINT("%d, %f\n", tempValues[i].first, tempValues[i].second);}}// 释放我们创建的数据内存,这个不是tensor里的if (NULL != pvData){free (pvData);pvData = NULL;}std::cout << "hello world " << std::endl;return 0;
}

MNN(二):借助Opencv实现MNN推理相关推荐

  1. 新手入门保姆级教程,Linux平台和手机端SDK,基于Opencv、MNN、NCNN

    端侧部署开源项目:https://github.com/hzpzlz/EasyDeploy 一 MNN编译动态库 环境要求 cmake(建议使用3.10或以上版本) protobuf(使用3.0或以上 ...

  2. 【python opencv 计算机视觉零基础到实战】二、 opencv文件格式与摄像头读取

    一.学习目标 了解图片的结构属性 了解如何捕获视频 了解waitkey的使用方法 目录 [python opencv 计算机视觉零基础到实战] 一.opencv的helloworld [[python ...

  3. 借助opencv将unsigned char数组显示为图像

    在用C或者C++做图像处理程序时,经常需要把结果图显示出来看看效果,这时候可以借助opencv的Mat类型,如下: Mat gray1_mat(rect_height, rect_width, CV_ ...

  4. 【OpenCV入门教程之十二】OpenCV边缘检测:Canny算子,Sobel算子,Laplace算子,Scharr滤波器合辑

    本系列文章由@浅墨_毛星云 出品,转载请注明出处. 文章链接: http://blog.csdn.net/poem_qianmo/article/details/25560901 作者:毛星云(浅墨) ...

  5. 二:OpenCV图片叠加逻辑运算

    通过图片叠加逻辑运算可以实现多种效果,如模版截取感兴趣区域,图片融合,色彩交叉等,本文涉及4个图片矩阵叠加逻辑运算函数,如下: 1.bitwise_and 2.bitwise_or 3.bitwise ...

  6. Android从零开始配置opencv+tensorflow进行人脸识别+口罩识别(二:opencv展示当前图像并作适当调整)

    前言 上一章已经成功导入了opencv,但并没说如何展示从摄像头获取图像并展示出来,这章将简单的说说怎么展示,以及里面出现的问题作修正 一.使用opencv正常展示图像 首先准备一个空的activit ...

  7. 树莓派Ubuntu mate中借助OpenCV实现摄像头定时拍照并保存python语言

    刚刚入门的小白,第一次写博客,有不妥的地方还望各路大佬多多指教~ 本帖主要是介绍利用python语言如何在树莓派Ubuntu mate中借助OpenCV实现摄像头给定间隔时间连续拍照,并以拍照时间命名 ...

  8. Java借助OpenCV实现人脸识别登录完整示例

    Java借助OpenCV实现人脸识别登录完整示例 OpenCV 效果预览 概述 下载与安装 目录说明 OpenCV的基本使用 项目集成 图片人脸检测 人脸对比相似度 识别视频中的人脸 摄像头识别人脸 ...

  9. 《OpenCv视觉之眼》Python图像处理二十三:OpenCV图像处理最终章之基于PyQt5的图像处理界面设计及功能实现

    本专栏主要介绍如果通过OpenCv-Python进行图像处理,通过原理理解OpenCv-Python的函数处理原型,在具体情况中,针对不同的图像进行不同等级的.不同方法的处理,以达到对图像进行去噪.锐 ...

  10. 《OpenCv视觉之眼》Python图像处理二十一:Opencv图像处理之图像线性变换和非线性变换的方法及原理

    本专栏主要介绍如果通过OpenCv-Python进行图像处理,通过原理理解OpenCv-Python的函数处理原型,在具体情况中,针对不同的图像进行不同等级的.不同方法的处理,以达到对图像进行去噪.锐 ...

最新文章

  1. Semaphore(信号量)
  2. Windows Phone 8 蓝牙标准
  3. C#方法参数传递-同时使用ref和out关键字
  4. Map .NET Concepts to the Lightning Platform——list,set,map
  5. 浅谈以太坊智能合约的设计模式与升级方法
  6. A watermeten 《Before an Exam》
  7. 操作系统--中断和异常
  8. PHP替换回车换行的三种方法
  9. 使用 Xtrabackup 在线对MySQL做主从复制【转】
  10. VMWare虚拟机三种网络形式
  11. Oracle Database 21c 十大新特性一览 - New Features
  12. clover写入efi_MAC 10.14 安装教程10-基于黑果小兵大神EFI文件的修改过程
  13. win7共享20人限制 清除_中控智慧考勤门禁_机器直连软件及清除管理员
  14. Eclipse中,使用Darkest主题,static方法在main中不是斜体的解决办法
  15. yshon对讲机如何调频率_对讲机频率怎么调?四步教你给对讲机调频
  16. idea修改主题和更换背景
  17. 用分支限界法解决人员安排问题(Personnel assignment problem)
  18. [转]中国佛学66句震撼世界的禅语
  19. 折页损失函数代码实现
  20. 闫令琪:Games101 现代计算机图形学-光线追踪(三):渲染方程和路径追踪path ray tracing 作业Assignment07解析

热门文章

  1. Tomcat 9.0 下载安装 配置
  2. asp.net门诊收费管理系统案例
  3. 纪念 C语言之父 丹尼斯·里奇 逝世11周年:他发明了计算机世界的钢筋水泥!...
  4. Windows 内核会换为 Linux 吗?
  5. android 外接键盘 五笔 百度输入法
  6. 智力题题目及答案【集合】
  7. iTunes只能装C盘吗_就这一篇:教你真正有效地解决爆满的C盘!
  8. 魔百盒 UNT403A UNT413A S905L3A卡刷精简固--S905L3A
  9. 为什么说Mobileye最辉煌的5年就是落后的5年
  10. python 关于Python看金庸小说的实验