基于DL的目标检测技术:R-CNN、Fast R-CNN、Faster R-CNN
目标检测:在给定的图片中精确找到物体所在位置,并标注出物体的类别。
目标检测=图像识别(CNN)+定位(回归问题/取图像窗口)
遇到多物体识别+定位多个物体?
用选择性搜索找出可能含有物体的框(候选框)判定得分。这些框之间是可以互相重叠互相包含的,从而避免暴力枚举的所有框了。
1.R-CNN
步骤一:训练(或者下载)一个分类模型(比如AlexNet)
步骤二:对该模型做fine-tuning
- 修改分类数
- 去掉最后一个全连接层
步骤三:特征提取
- 提取图像的所有候选框(选择性搜索)
- 对于每一个区域:修正区域大小以适合CNN的输入,做一次前向运算,将第五个池化层的输出(就是对候选框提取到的特征)存到硬盘
步骤四:训练一个SVM分类器(二分类)来判断这个候选框里物体的类别
- 每个类别对应一个SVM,判断是不是属于这个类别,是就是正类,反之负类
步骤五:训练一个回归器精细修正候选框位置:对于每一个类,训练一个线性回归模型去判定这个框是否框得完美。
速度瓶颈
计算机对所有候选框进行特征提取时会有重复计算。
2.Fast R-CNN
在RCNN的基础上采纳了SPP Net方法(空间金字塔池化)
- 整张图输入CNN提取一次特征
- 找出每个候选框在feature map上的映射patch
速度瓶颈
选择性搜索,找出所有的候选框这个过程也耗时
3.Faster R-CNN
在Fast R-CNN的基础上加入一个提取候选区域的网络RPN(Region Proposal Network),代替了费时的选择性搜索,使得检测速度大幅提高。
具体做法
- 将RPN放在CNN最后一个卷积层的后面
- RPN直接训练得到候选区域
RPN简介
- 本质是 “ 基于滑窗的无类别目标检测器 ” :
- 在feature map上滑动窗口产生锚点
- 建立一个神经网络用于物体分类+框位置的回归
- 滑动窗口的位置提供了物体的大体位置信息
- 框位置的回归提供了框更精确的位置
基于DL的目标检测技术:R-CNN、Fast R-CNN、Faster R-CNN相关推荐
- 自动驾驶采标系列三:基于图像的目标检测技术
标注猿的第54篇原创 一个用数据视角看AI世界的标注猿 上一篇文章我们从"环境感知"数据的采集设备上进行了详细说明,已经了解了相应设备采集的数据及采集前 ...
- 目标检测技术演化:从R-CNN到Faster R-CNN
摘要: 一文了解目标检测技术发展,不要错过哟. 目标检测旨在准确地找到给定图片中物体的位置,并将其正确分类.准确地来讲,目标检测需要确定目标是什么以及对其定位. 然而,想要解决这个问题并不容易.因为, ...
- [转]一文读懂目标检测:R-CNN、Fast R-CNN、Faster R-CNN、YOLO、SSD
版权声明:本文为博主原创文章,未经博主允许不得转载. https://blog.csdn.net/kwame211/article/details/88016151 一.目标检测常见算法 object ...
- 深度学习之目标检测:R-CNN、Fast R-CNN、Faster R-CNN
object detection 就是在给定的图片中精确找到物体所在位置,并标注出物体的类别.object detection 要解决的问题就是物体在哪里,是什么这整个流程的问题.然而,这个问题不是容 ...
- 一文读懂目标检测:R-CNN、Fast R-CNN、Faster R-CNN、YOLO、SSD
前言 之前我所在的公司七月在线开设的深度学习等一系列课程经常会讲目标检测,包括R-CNN.Fast R-CNN.Faster R-CNN,但一直没有比较好的机会深入(但当你对目标检测有个基本的了解之后 ...
- 自动驾驶采标系列四:基于激光雷达的目标检测方法
标注猿的第55篇原创 一个用数据视角看AI世界的标注猿 上一篇文章我们讲了基于图像的目标检测技术,但对于标注人员来说这部分内容就相对比较难一些,只是作为一个了解就可以,但是如 ...
- 目标检测(R-CNN、Fast R-CNN、Fater R-CNN)
目标检测(R-CNN.Fast R-CNN.Faster R-CNN) 1.目标检测(object detection) 图像识别是输入一张图像,输出该图像对应的类别.目标检测的输入同样是一张国像,但 ...
- 基于深度学习的高分辨率遥感图像目标检测技术目前的研究现状
参考 基于深度学习的高分辨率遥感图像目标检测技术目前的研究现状 - 云+社区 - 腾讯云 目录 一.概述 二.通用目标检测方法 1.类不平衡问题 2.复杂背景 3.目标的尺度变化 4.特殊视角 5 ...
- 基于深度学习的目标检测技术的演进:从R-CNN到Faster R-CNN
导语 什么是Objection Detection?就是在给定的图片中精确的找到物体所在位置,并且标注出物体的类别.目标检测要解决的问题就是物体在哪里?是什么?这样的问题.然而,这个问题并不是那么容易 ...
- 基于深度学习的目标检测技术演进:从目标检测到人脸检测
本篇博客主要转载两篇写得好的分别介绍基于深度学习的目标检测和人脸检测的文章,最近在调研基于深度学习的人脸检测相关的文章,在网上查相关资料时,有幸看到.文末附带基于深度学习的目标检测和人脸检测相关经典文 ...
最新文章
- DWRUtil的方法使用说明
- [转] GloVe公式推导
- 未来,仅凭几个前端工程师,就能 hold 住一家企业吗?
- 分析递归函数的时间复杂度
- linux7 语言包,Centos 7中文语言包的安装及中文支持
- css html 方格,使用CSS创建方格背景
- C++学习笔记56:异常处理
- 阶段1 语言基础+高级_1-3-Java语言高级_06-File类与IO流_01 File类_6_File类判断功能的方法...
- Java中的Arrays类使用详解
- 医学系统(一)医院常用的软件系统:PACS系统、HIS系统、RIS系统、LIS系统、CIS系统
- mysql数据库应用(六)----操作表的约束
- 计算机仿真和vr的区别,你真的知道AR与VR的区别吗?
- java web实现拨打电话_Android实现打电话功能
- CVPR2018 ——(GAN)延时摄影视频的生成
- 画论24 郭若虛《图画见闻志》
- windows服务启动 1053错误
- 非支配排序遗传算法c语言,第三代非支配排序遗传算法(NSGA-III)
- 前端把其他格式图片转成png,jpg格式后下载,下载txt文件
- cmd怎么删除流氓软件?
- 如何选购计算机硬件,DIY攒机经验之谈:十年老司机教你组装电脑如何选购硬件...
热门文章
- 关于在用Swift开发iOS时如何隐藏NavigationBar和TabBar
- Enterprise Manager 无法连接到数据库实例。下面列出了组件的状态。
- Sun发布MySQL 5.4 响应速度提升90% ?
- 基于.NET平台的分层架构实战(八)——数据访问层的第二种实现:SQLServer+存储过程...
- 2k2实用球员_2KOL2王朝不知道用谁?五大位置低价实用球员大解析!
- SpringMVC+Spring Data JPA +Bootstrap 分页实现和模糊查询分页
- STC学习:八位数码管滚动显示
- 安卓项目连接后台服务器,android云后端服务器
- 台式电脑显示器黑屏但灯亮_显示器黑屏无信号 但电脑一直在运行的原因和解决办法...
- r语言集合补集_极速统计教程之八 | 概率和集合