本文章由公号【开发小鸽】发布!欢迎关注!!!

老规矩–妹妹镇楼:

一.分类与定位

(一)定义

我们不光要对物体进行分类,还要对物体在图片中的位置进行定位。

(二)分类任务

输入图片,输出分类的标签,评估的标准是分类的准确性。

如下图所示:输入一张图片,输出标签为CAT。

(三)定位任务

       输入图片,输出一个图片中的一个方框,该方框用向量(x,y,w,h)表示。X是左上角x轴坐标,y是左上角y轴坐标,w是方框的宽度,h是方框的高度。

评估的标准是:正确方框位置和输出的方框位置的重合程度。重合程度越高,那么定位越准确。

二.定位过程

在机器学习中,我们学习了回归的概念,通过计算输出值和正确值的差距损失值,反向传播修改参数,直到损失值越来越小,输出值与正确值差距减小,满足我们的需求。

       定位的过程也是类似的,通过卷积神经网络计算出方框的位置,计算和正确方框位置的损失值,方向传播修改参数,使损失值越来越小,输出的方框和正确方框越来越接近。

三.分类和定位过程

(一)总体过程

输入图片,通过卷积神经网络提取特征,在得出的最后一层的卷积特征图后,设置两种全连接层任务,一种是分类任务,另一种是回归任务。

分类全连接神经网络:正常的全连接分类神经网络,将图片的类别标出来。

回归全连接神经网络:通过回归得出最优的方框位置。

(二)具体步骤

  1. 训练一个分类模型或者微调一个分类模型(AlexNet,VGGNet)

所谓微调一个分类模型指的是将已经很成熟的模型调一下基本参数,已适用于本次分类任务。这样,避免了自己训练一个模型的成本。

  1. 给网络添加一个新的全连接层用于回归方框的位置参数。

  2. 用随机梯度下降(SGD)和欧氏距离损失(L2 LOSS)来训练回归层。

  3. 同时测试分类和回归。

(三)回归层应该添加在哪里呢?

  1. 添加在最后一层卷积之后。如Overfeat,VGG

  2. 添加在最后的全连接层之后。如DeepPose, R-CNN

四.滑动窗口

滑动窗口就是为了在输入图片中找出猫,通过在输入图片中滑动设置好的窗口,得出每个窗口中分类为猫的概率值。找出概率值最高的窗口区域,作为定位的区域。

如下所示:

上图中左图为滑动窗口,右图为输入图像,在图像中滑动四次,得出的最大概率值区域用于定位回归。

下图为滑动后得到的概率值,取最大的0.8区域作为定位区域。

那么现在问题出现了,滑动窗口的尺寸不可能总是和图片中猫的尺寸相适应,可能有的图片中猫的尺寸非常小,那么滑动窗口的尺寸相对于该图片中的猫的尺寸非常大,那么就很难检测出猫,计算出概率值。

       因此,不同的图片需要不同的预处理 ,通过调整输入图片的尺寸,猫的尺寸也得以调整,以适应滑动窗口的尺寸,便于物体的检测。

【深度学习笔记(九)】之物体的分类与定位相关推荐

  1. 一文让你完全弄懂逻辑回归和分类问题实战《繁凡的深度学习笔记》第 3 章 分类问题与信息论基础(上)(DL笔记整理系列)

    好吧,只好拆分为上下两篇发布了>_< 终于肝出来了,今天就是除夕夜了,祝大家新快乐!^q^ <繁凡的深度学习笔记>第 3 章 分类问题与信息论基础 (上)(逻辑回归.Softm ...

  2. 深度学习笔记(13) Softmax分类

    深度学习笔记(13) Softmax分类 1. Softmax 回归 2. 练一个Softmax分类器 1. Softmax 回归 有一种logistic回归的一般形式,叫做 Softmax回归 能在 ...

  3. 深度学习笔记(九):神经网络剪枝(Neural Network Pruning)详细介绍

    文章目录 1:What is pruning 2:Pruning in MLP(多层感知机) 2.2 How to make mask 3.Pruning in CNN(卷积神经网络) 1:What ...

  4. 一文让你完全弄懂回归问题、激活函数、梯度下降和神经元模型实战《繁凡的深度学习笔记》第 2 章 回归问题与神经元模型(DL笔记整理系列)

    <繁凡的深度学习笔记>第 2 章 回归问题与神经元模型(DL笔记整理系列) 3043331995@qq.com https://fanfansann.blog.csdn.net/ http ...

  5. 深度学习笔记(18) 迁移学习

    深度学习笔记(18) 迁移学习 1. 迁移学习理念 2. 图像识别的迁移学习 3. 语音识别的迁移学习 4. 使用迁移学习的场合 1. 迁移学习理念 深度学习中最强大的理念之一就是: 神经网络可以从一 ...

  6. 深度学习笔记(17) 误差分析(二)

    深度学习笔记(17) 误差分析(二) 1. 使用来自不同分布的数据进行误差分析 2. 数据分布不匹配时的偏差与方差 3. 处理数据不匹配问题 1. 使用来自不同分布的数据进行误差分析 越来越多的团队都 ...

  7. 深度学习笔记(16) 误差分析(一)

    深度学习笔记(16) 误差分析(一) 1. 进行误差分析 2. 清除标注错误的数据 1. 进行误差分析 假设正在调试猫分类器 然后在开发集取得了90%准确率,相当于10%错误 这离希望的目标还有很远 ...

  8. 深度学习笔记(14) 评估指标

    深度学习笔记(14) 评估指标 1. 正交化 2. 单一数字评估指标 3. 满足和优化指标 4. 改变开发/测试集和指标 1. 正交化 搭建建立机器学习系统的挑战之一是,可以尝试和改变的东西太多太多了 ...

  9. HALCON 21.11:深度学习笔记---分类(10)

    HALCON 21.11:深度学习笔记---分类(10) HALCON 21.11.0.0中,实现了深度学习方法. 本章介绍了如何在训练和推理阶段使用基于深度学习的分类. 基于深度学习的分类是一种对一 ...

  10. HALCON 20.11:深度学习笔记(10)---分类

    HALCON 20.11:深度学习笔记(10)---分类 HALCON 20.11.0.0中,实现了深度学习方法. 本章解释了如何在训练和推理阶段使用基于深度学习的分类. 基于深度学习的分类是一种对一 ...

最新文章

  1. TCP协议的服务器与客户端的程序设计(代码注释超详细)
  2. ABAP简介以及OpenSQL与NativeSQL的区别
  3. Python 函数参数传递
  4. 南邮计算机科学与技术PK杭电,被985录取,却后悔没去杭电南邮,双非热门专业真的这么吃香吗?...
  5. python 多进程 调用模块内函数_python子进程模块subprocess详解与应用实例 之一
  6. oppo手机维语字体_老年人上网困难重重?学会OPPO这几个功能无后顾之忧
  7. World Cup 996B(排队模拟)
  8. 如何看待不会写代码的架构师?
  9. Centos7安装Docker(二进制)
  10. 科学家组建大数据平台解决科研资源共享难题
  11. matlab简单分析信号调制解调
  12. 跳跃回溯____寻找最长平台
  13. numpy广播机制小结
  14. 使用google analytics(分析)监测百度竞价关键词效果(网址构建工具)
  15. 博途下载触摸屏程序时提示缺少面板映像
  16. 【Windows Server 2019】企业虚拟专用网络服务的配置和管理(上)
  17. 微软强调Win8.1 Update照顾惯用键鼠用户
  18. 低功耗设计(low power design)和UPF介绍(含代码示例)
  19. WebSocket(3)---实现一对一聊天功能
  20. 信息化技术在农业上的应用

热门文章

  1. FFmpeg音视频播放器实现
  2. 使用SP Racing F3飞控ROSflight软件包的无人机自主飞行系统
  3. 腾讯对战平台显示版本服务器连接超时,腾讯对战平台怎么了_腾讯对战平台出现问题怎么解决...
  4. 新版Uniapp开发多端影视APP源码+对接苹果CMS
  5. Error:Apostrophe not preceded by \ (
  6. SaaS行业的六大安全问题
  7. matlab绘制凸多面体,科学网—MATLAB中计算凸多边形面积和凸多面体体积的简便方法 - 王福昌的博文...
  8. 【数据库原理】关系-Relationship
  9. Power BI(十二)Power Pivot时间智能函数
  10. 我的练习项目: 模拟淘宝搜索商品、添加商品到购物车功能、修改商品信息功能