什么是目标检测--Object Detection
目标检测,也叫目标提取,是一种基于目标几何和统计特征的图像分割。它将目标的分割和识别合二为一,其准确性和实时性是整个系统的一项重要能力。目标检测不仅要用算法判断图片中物品的分类, 还要在图片中标记出它的位置, 用边框或红色方框把物品圈起来, 这就是目标检测问题。
目标检测从2001年开始,在2012年成为分水岭,因为这一年基于深度学习的目标检测方法,逐渐使目标检测进入到快速发展的阶段,比较流行的算法可以分为两类,一类是基于Region Proposal的R-CNN系算法(RCNN、SPPNet、FasterRCNN、Pyramid NetWorks等),它们是two-stage的,需要先算法产生目标候选框,也就是目标位置,然后再对候选框做分类与回归。而另一类是Yolo,SSD这类one-stage算法,其仅仅使用一个卷积神经网络CNN直接预测不同目标的类别与位置。第一类方法是准确度高一些,但是速度慢,但是第二类算法是速度快,但是准确性要低一些。
一、统一的实时的目标检测
yolo将特征图划分为SXS的格子,每个格子负责对落入其中的目标进行检测,一次性预测所有格子所含目标不的边界框、定位置信度以及所有类别概率向量。
yolo算法的基本思想
(1)预测特征图
(2)多尺度整合
(3)锚框机制(Anchor)
通过特征提取网络对输入的图像进行特征提取,得到一定大小的特征图
预测得到的输出特征图有两个维度是摄取到的特征维度。
(1)非极大值抑制(NMS--Non-Maximum Suppression)
(2)损失函数(Loss Function)
包括:分类损失、定位损失、置信度损失
总的损失函数=分类损失+定位损失+置信度损失
二:目标检测的性能
检测精度 | 检测速度 |
Precision,Recall,F1 Score | 前传耗时 |
IoU(交并比) | FPS(每秒帧数) |
P-R curve | 浮点运算量(Flops) |
AP(Average Precision) | |
mAP(mean Average Precision) |
(一)精度
1、什么是混淆矩阵
精度:Precision=TP/(TP+FP)
召回率:Recall=TP/(TP+FN)
F1 score=2*Precision*Recall/(Precision+Recall)
2、IoU(交并比)
3、AP与mAP
AP衡量的是学习出来的模型在每个类别上的好坏。
mAP衡量的是学出来的模型在所有类别上的好坏,是所有类别AP的平均值。
(二)检测速度
1、前传耗时(ms):从输入的一张图像到输出最终检测结果所消耗的时间。
2、每秒帧数(FPS):每秒钟能处理的图像数量。
3、浮点运算量(FLOPS):处理的每一张图像所需要的浮点运算数量。
三:目标检测数据集
1、Pascal Voc
Pacal VOC挑战赛在2005年-2012年间展开,共有两个数据集 Pascal VOC2007(9963张图像,24640个标注)和Pascal VOC2012(11530张图像,27450个标注),该数据集有20个分类。
2、MS COCO
起源于微软于2014年出资标注的Microsoft COCO数据集,与ImageNet竞赛一样,被视为是计算机视觉领域最受关注和最权威的比赛之一。COCO数据集包含20万个图像,其中11.5万张训练集图像,5千张验证集图像,2万多张测试集图像。80个类别中有超过50万个目标标注。
COCO竞赛成为当前目标识别和检测等领域的一个最权威、最重要的标杆,也是目前该领域在国际上能唯一能汇集Google、微软、Facebook以及国内外众多顶尖院校和优秀企业共同参与的大赛。
网站地址:http://cocodataset.org
四:目前国内主流的目标检测技术:
1、YOLOX:由中国的旷视科技研发,是目前国际上运行速度最快的一种深度学习模型。
2、YOLOV1-V5:Yolov1-yolov3由Joseph Redmon研发,yolov4-yolov5则是由yolo团队内部成员完成的。
3、Transformer:原来是做为语音识别的一个模型,现在用在图像的目标识别上面也有不俗的表现
4、ViT:当考虑预训练模型的计算成本时,ViT的性能非常好,以较低的预训练成本在大多数识别基准上达到了最先进的水平。
以下为课程预告,我们将遂一的为大家介绍以上目标检测技术,有兴趣的小伙伴可以关注我的微博,我将随时公布培训时间及报名方式。
什么是目标检测--Object Detection相关推荐
- CV之OD:计算机视觉之目标检测(Object Detection)方向的简介、使用方法、案例应用之详细攻略
CV之OD:计算机视觉之目标检测(Object Detection)方向的简介.使用方法.案例应用之详细攻略 目录 OD目标检测的简介 1.Selective Search for Object Re ...
- 同r做一个窗口_目标检测(Object Detection):R-CNN/SPPnet/R-FCN/Yolo/SSD
这篇文章我是Survey目标检测(Object Detection)系列论文的一个总结. 包括R-CNN系列.SPP-net.R-FCN.YOLO系列.SSD.DenseBox等. 基本概念 目标识别 ...
- [Intensive Reading]目标检测(object detection)系列(九) YOLOv3:取百家所长成一家之言
目标检测系列: 目标检测(object detection)系列(一) R-CNN:CNN目标检测的开山之作 目标检测(object detection)系列(二) SPP-Net:让卷积计算可以共享 ...
- 快速目标检测--Object detection at 200 Frames Per Second
Object detection at 200 Frames Per Second 本文在 Tiny Yolo 的基础上设计了一个目标检测网络,在 Nvidia 1080ti 上可以达到 100帧每秒 ...
- 目标检测--Object Detection via Aspect Ratio and Context Aware
Object Detection via Aspect Ratio and Context Aware Region-based Convolutional Networks https://arxi ...
- 深度学习目标检测(object detection)系列(一) R-CNN
原文链接 R-CNN简介 R-CNN提出于2014年,应当算是卷积神经网络在目标检测任务中的开山之作了,当然同年间还有一个overfeat算法,在这里暂不讨论. 在之后的几年中,目标检测任务的CNN模 ...
- 对象检测(Object Detection)DNN-YOLOv3讲解
文章目录 1 概述 2 如何衡量对象检测的结果 2.1 准确性(precision)和召回率(recall) 2.2 准确率-召回率曲线(precision-recall curve).平均准确率(A ...
- [caffe]深度学习之CNN检测object detection方法摘要介绍
[caffe]深度学习之CNN检测object detection方法摘要介绍 2015-08-17 17:44 3276人阅读 评论(1) 收藏 举报 一两年cnn在检测这块的发展突飞猛进,下面详 ...
- 【手把手AI项目】八、MobileNetSSD通过Ncnn前向推理框架在Android端的使用--Cmake编译(目标检测 objection detection)
一.前言 安装win10+linux-Ubuntu16.04的双系统(超细致) ubuntu16.04+caffe+CUDA10.0+cudnn7.4+opencv2.4.9.1+python2.7 ...
最新文章
- canny边缘检测 关于2个阈值参数
- 安卓手机怎么查看iccid_安卓便签敬业签怎么查看日历月视图中一天所有的新增内容?...
- linux中spawn远程执行,linux 远程登录执行命令
- 实例讲解getopt()函数的使用
- 计算机网络常用五大领域命令,现代信息技术试题精选
- 【深度优先搜索】计蒜客:最大蛋糕(最大连通块)
- 分享24款非常有用的 jQuery 插件
- WTL学习笔记(5)系统皮肤管理
- unity迷你太空射击游戏截图
- python为什么是蛇的天敌_青蛙和蛇一直是天敌,只知道蛇会吃青蛙,你知不知道青蛙也吃蛇...
- 竟事而后言——谨记微言,聊以自省
- NET::ERR_INCOMPLETE_CHUNKED_ENCODING 200 (OK)
- 科研——多问、多交流
- CheckBox复选框全选以及获取值(转)
- iOS 通过定位获取常驻后台
- Linux中清除痕迹和隐藏自己-清除last login
- H5/C3实践(2) --3D导航栏旋转木马
- HTML5期末大作业:商城页面——仿优分购电商静态网页(7个页面) HTML+CSS+JavaScript 电商购物网页HTML代码 学生网页课程设计期末作业下载 大学生网页设计制作成...
- java驱动打印机_本地打印机驱动程序如何找到网络打印机?
- Integrating Dokuwiki with Mantis
热门文章
- 7-10 小H喜欢睡觉
- npm报错:npm ERR! Unexpected end of JSON input while parsing near '...:699f0881bb7f461113
- roscore的执行
- fh511小风扇主控芯片 便携式小风扇专用8脚IC 三档小风扇升压芯片sop8
- YunTable开发日记(16)-教程(0.9版RC)
- 数字化管理门店| 甜品店管理系统
- JavaScript之form(表单)
- AQS的核心方法-acquire()解析
- C语言获取窗口dc,C语言新案例-捕获电脑桌面并打印
- php制作万年历的步骤_使用PHP制作一个万年历