点击上方“小白学视觉”,选择加"星标"或“置顶

重磅干货,第一时间送达

本文转自:opencv学堂

Network in Network(NIN)

要介绍Inception网络结构首先应该介绍一下NIN(Network in Network)网络模型,2014年新加坡国立大学发表了一篇关于计算机视觉图像分类的论文,提到采用了一种新的网络结构NIN实现图像分类,该论文的第二作者颜水成毕业于北京大学数学系,现任360人工智能研究院院长与首席科学家。NIN主要思想是认为CNN网络中卷积滤波是基于线性滤波器实现的,抽象能力不够,所以一般是用一大堆filter把所有特征都找出来,但是这样就导致网络参数过大,论文作者提出通过MLP(多个权重阶层组成+一个非线性激活函数)对输入区域通过MLP产生一个输出feature map,然后继续滑动MLP窗口,对比如下:

这样做有两个好处,

  1. MLP可以共享参数,减少参数总数

  2. 对每个局部感受野神经元实现更加复杂计算,提升能力

论文中提到NIN网络完整结构如下:

包含了三个MLP卷积层与一个全局池化层。

Inception v1

受到这篇文章的影响与启发,谷歌在2014也提出一个新的网络模型结构Inception网络也就是大家熟知v1网络,其主要贡献在于实现了NIN网络层数的增加,并且在训练各个网络时候为了提高收敛,考虑中间层的输出与最终分类错误。只是中间层不同,最初inception网络的中间层为:

后来发现3x3与5x5的卷积计算耗时很长,而且输出导致卷积厚度增加,如果层数过度将导致卷积网络不可控制,于是就在3x3与5x5的卷积之前分别加上1x1的卷积做降维,修改后的结构如下:

最终得到v1版本的网络结构如下:

Inception v2 and Inception v3

于是在v1的基础上作者继续工作,加入了BN层,对大于3x3的卷积用一系列小的卷积进行替代,比如7x7可以被1x7与7x1替代两个小卷积核,5x5可以被1x5与5x1两个小卷积核替代,这样就得到Inception v2的版本。于是作者继续对此网络结构各种优化调整,最终又得到了Inception v3版本

Inception v4

Inception v4一个最大的改动就是引入了残差网络结构,对原有的网络结构进行优化,得到v1与v2的残差版本网络结构,最终得到一个更加优化的v4模型,完整的v4结构:

对应的Block A、B、C结构如下:Inception-A

Inception-B

Inception-C

v1模型加残差网络结构

OpenCV DNN模块中使用Inception模型

  1. 下载Inception预训练网络模型

  2. 使用OpenCV DNN模块相关API加载模型

  3. 运行Inception网络实现图像分类 完整的代码实现如下:

#include <opencv2/opencv.hpp>
#include <opencv2/dnn.hpp>
#include <iostream>
/******************************************************
*
* 作者:贾志刚
* QQ: 57558865
* OpenCV DNN 完整视频教程:
* http://edu.51cto.com/course/11516.html
*
********************************************************/
using namespace cv;
using namespace cv::dnn;
using namespace std;
String labels_txt_file = "D:/android/opencv_tutorial/data/models/inception5h/imagenet_comp_graph_label_strings.txt";
String tf_pb_file = "D:/android/opencv_tutorial/data/models/inception5h/tensorflow_inception_graph.pb";
vector<String> readClassNames();
int main(int argc, char** argv) {Mat src = imread("D:/vcprojects/images/twocat.png");if (src.empty()) {printf("could not load image...\n");return -1;}namedWindow("input", CV_WINDOW_AUTOSIZE);imshow("input", src);vector<String> labels = readClassNames();Mat rgb;cvtColor(src, rgb, COLOR_BGR2RGB);int w = 224;int h = 224;// 加载网络Net net = readNetFromTensorflow(tf_pb_file);if (net.empty()) {printf("read caffe model data failure...\n");return -1;}Mat inputBlob = blobFromImage(src, 1.0f, Size(224, 224), Scalar(), true, false);inputBlob -= 117.0; // 均值// 执行图像分类Mat prob;net.setInput(inputBlob, "input");prob = net.forward("softmax2");// 得到最可能分类输出Mat probMat = prob.reshape(1, 1);Point classNumber;double classProb;minMaxLoc(probMat, NULL, &classProb, NULL, &classNumber);int classidx = classNumber.x;printf("\n current image classification : %s, possible : %.2f", labels.at(classidx).c_str(), classProb);// 显示文本putText(src, labels.at(classidx), Point(20, 20), FONT_HERSHEY_SIMPLEX, 1.0, Scalar(0, 0, 255), 2, 8);imshow("Image Classification", src);imwrite("D:/result.png", src);waitKey(0);return 0;
}
std::vector<String> readClassNames()
{std::vector<String> classNames;std::ifstream fp(labels_txt_file);if (!fp.is_open()){printf("could not open file...\n");exit(-1);}std::string name;while (!fp.eof()){std::getline(fp, name);if (name.length())classNames.push_back(name);}fp.close();return classNames;
}

输入原图:

测试结果:

关键是速度很快,比VGG快N多,基本秒出结果!

下载1:OpenCV-Contrib扩展模块中文版教程

在「小白学视觉」公众号后台回复:扩展模块中文教程即可下载全网第一份OpenCV扩展模块教程中文版,涵盖扩展模块安装、SFM算法、立体视觉、目标跟踪、生物视觉、超分辨率处理等二十多章内容。

下载2:Python视觉实战项目52讲

在「小白学视觉」公众号后台回复:Python视觉实战项目即可下载包括图像分割、口罩检测、车道线检测、车辆计数、添加眼线、车牌识别、字符识别、情绪检测、文本内容提取、面部识别等31个视觉实战项目,助力快速学校计算机视觉。

下载3:OpenCV实战项目20讲

在「小白学视觉」公众号后台回复:OpenCV实战项目20讲即可下载含有20个基于OpenCV实现20个实战项目,实现OpenCV学习进阶。

交流群

欢迎加入公众号读者群一起和同行交流,目前有SLAM、三维视觉、传感器、自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN、算法竞赛等微信群(以后会逐渐细分),请扫描下面微信号加群,备注:”昵称+学校/公司+研究方向“,例如:”张三 + 上海交大 + 视觉SLAM“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告,否则会请出群,谢谢理解~

利用OpenCV 基于Inception模型图像分类相关推荐

  1. 第一部分 利用opencv基于hsv颜色的目标提取效果和python代码

    因为做毕设,想找个地方记录一下毕设当初写的东西. 第一部分,HSV模型进行颜色提取 先放效果图: 图1 左右摄像头采集到的乒乓球图像 图 2 HSV模型颜色提取器 图 2 HSV模型提取的效果图 提取 ...

  2. tf11: retrain谷歌Inception模型

    前一帖使用到了谷歌训练的Inception模型,本帖就基于Inception模型retrain一个图像分类器. 图像分类器应用广泛,连农业都在使用,如判断黄瓜种类. 本帖使用的训练数据是PixelCN ...

  3. TensorFlow练习11: 图像分类器 – retrain谷歌Inception模型(转)

    原文地址:https://www.tuicool.com/articles/ieQZVfa 前一帖< TensorFlow练习10: 实现谷歌Deep Dream >使用到了谷歌训练的In ...

  4. CV之IE之Inception:基于TF框架利用Inception模型+GD算法的某层网络图像生成不同尺寸和质量的Deep Dream幻觉梦境图片(特征可视化实现图像可解释性)—五个架构设计思维导图

    CV之IE之Inception:基于TF框架利用Inception模型+GD算法的某层网络图像生成不同尺寸和质量的Deep Dream幻觉梦境图片(特征可视化实现图像可解释性)-五个架构设计思维导图 ...

  5. CV之IG之Inception:基于TF框架利用Inception模型+GD算法的某层网络图像生成带背景的不同尺寸高质量的Deep Dream幻觉梦境图片(特征可视化实现图像可解释性)案例

    CV之IG之Inception:基于TF框架利用Inception模型+GD算法的某层网络图像生成带背景的不同尺寸高质量的Deep Dream幻觉梦境图片(特征可视化实现图像可解释性)案例 目录 基于 ...

  6. CV之IG之Inception:基于TF框架利用Inception模型+GD算法的某层网络图像生成更高质量的Deep Dream幻觉梦境图片(特征可视化实现图像可解释性)案例应用

    CV之IG之Inception:基于TF框架利用Inception模型+GD算法的某层网络图像生成更高质量的Deep Dream幻觉梦境图片(特征可视化实现图像可解释性)案例应用 目录 基于TF框架利 ...

  7. CV之IG之Inception:基于TF框架利用Inception模型+GD算法的某层网络图像生成更大尺寸的Deep Dream幻觉梦境图片(特征可视化实现图像可解释性)案例应用

    CV之IG之Inception:基于TF框架利用Inception模型+GD算法的某层网络图像生成更大尺寸的Deep Dream幻觉梦境图片(特征可视化实现图像可解释性)案例应用 目录 基于TF框架利 ...

  8. CV之IG之Inception:基于TF框架利用Inception模型+GD算法的某层网络图像生成原始的Deep Dream幻觉梦境图片(特征可视化实现图像可解释性)案例应用

    CV之IG之Inception:基于TF框架利用Inception模型+GD算法的某层网络图像生成原始的Deep Dream幻觉梦境图片(特征可视化实现图像可解释性)案例应用 目录 基于TF框架利用I ...

  9. 基于Tensorflow + Opencv 实现CNN自定义图像分类

    摘要:本篇文章主要通过Tensorflow+Opencv实现CNN自定义图像分类案例,它能解决我们现实论文或实践中的图像分类问题,并与机器学习的图像分类算法进行对比实验. 本文分享自华为云社区< ...

最新文章

  1. 解决R 4.0版本包的安装错误
  2. 网站流量排名常用名词pv_ip_alex_uv
  3. Python学习笔记:常用内建模块3:struct
  4. 创建DLL、Lib以及使用DLL、Lib
  5. Android之开发中用到的几个多线程解析
  6. Ubuntu下将Sublime Text设置为默认编辑器
  7. 有一个小白程序员,写了一个只能对5个数字进行排序的函数,现在有25个不重复的数字,
  8. JavaScript编程规范-有利于效率和可读性
  9. 淘宝天猫页面详情采集API调用展示(APP端商品详情)
  10. 采用esxcli命令操作esxi主机防火墙
  11. 易康(eCognition)对象几何特征--1:几何(Geometry)_范围(Extent)
  12. 能链发布数字藏品为用户定制专属数字礼物
  13. python爬取微信小程序源代码_【实战】CrawlSpider实现微信小程序社区爬虫
  14. 解决“应用程序正常初始化(0x00000005)失败”错误
  15. JS判断当前页面是否在微信内打开
  16. 塑料壳上下扣合的卡扣设计_塑胶件结构设计之止口与扣位的设计
  17. 《数字图像处理》笔记—空间滤波
  18. python画蜡烛图_Python量化交易-绘制蜡烛图 !这个图不像你的钱哦!
  19. MyBatis是啥子东西?是一个DAO层的框架
  20. 斗破苍穹模拟器显示服务器人满,斗破苍穹手游服务器爆满怎么进 挤进爆满区...

热门文章

  1. 自然语言处理十问!独家福利
  2. 7年增长16倍,清华AI+ML课程学生数暴增 | AI Index 2018
  3. 教程 | 如何在手机上使用TensorFlow
  4. Spring Cloud Gateway CORS 方案看这篇就够了
  5. 又出现依赖冲突?试试 IDEA 解决 Maven 依赖冲突的高能神器!
  6. 深入理解 Mybatis 插件开发
  7. 你真的会写二分检索吗?
  8. 如何配置一台深度学习工作站?
  9. 让机器“看见”:图像数据的特征提取方法
  10. 卷积神经网络(CNN)综述