你要的2019最全目标检测都在这里啦！

大数据文摘出品

编译：张睿毅、宁静

计算机视觉是一门研究如何对数字图像或视频进行高层语义理解的交叉学科，它赋予机器“看”的智能，需要实现人的大脑中（主要是视觉皮层区）的视觉能力。

想象一下，如果我们想为盲人设计一款导盲产品，盲人过马路时系统摄像机拍到了如下的图像，那么需要完成那些视觉任务呢？

图像分类：为图片中出现的物体目标分类出其所属类别的标签，如画面中的人、楼房、街道、车辆数目等；
目标检测：将图片或者视频中感兴趣的目标提取出来，对于导盲系统来说，各类的车辆、行人、交通标识、红绿灯都是需要关注的对象；
图像语义分割：将视野中的车辆和道路勾勒出来是必要的，这需要图像语义分割技术做为支撑，勾勒出图像物体中的前景物体的轮廓；
场景文字识别：道路名、绿灯倒计时秒数、商店名称等，这些文字对于导盲功能的实现也是至关重要的。

以上已经囊括了计算机视觉（CV）领域的四大任务，在CV领域主要有八项任务，其他四大任务包括：图像生成、人体关键点检测、视频分类、度量学习等。

目标检测作为CV的一大任务之一，其对于图片的理解也发挥着重要的作用，在本文中，我们将介绍目标检测的基础知识，并回顾一些最常用的算法和一些全新的方法。（注：每个小节展示的论文图片，均在节末给出了具体的链接）

目标检测如何运作

目标检测定位图像中物体的位置，并在该物体周围绘制边界框，这通常涉及两个过程，分类物体类型，然后在该对象周围绘制一个框。现在让我们回顾一下用于目标检测的一些常见模型架构：

R-CNN
Fast R-CNN
Faster R-CNN
Mask R-CNN
SSD (Single Shot MultiBox Defender)
YOLO (You Only Look Once)

R-CNN

该技术结合了两种主要方法：将高容量卷积神经网络应用于自下而上的候选区域，以便对物体进行局部化和分割，并监督辅助任务的预训练。接下来是特定领域的微调，从而产生高性能提升。论文的作者将算法命名为R-CNN（具有CNN特征的区域），因为它将候选区域与卷积神经网络相结合。

模型接收图像并提取约2000个自下而上的候选区域，然后，它使用大型CNN计算每个候选区域的特征，此后，它使用特定类的线性支持向量机（SVM）对每个区域进行分类，该模型在PASCAL VOC 2010上实现了53.7％的平均精度。

模型中的物体检测系统有三个模块：第一个负责生成与类别无关的候选区域，这些候选区域定义了模型检测器可用的候选检测器集；第二个模块是一个大型卷积神经网络，负责从每个区域提取固定长度的特征向量；第三个模块由一类支持向量机组成。

模型内部使用选择性搜索来生成区域类别，选择性搜索根据颜色、纹理、形状和大小对相似的区域进行分组。对于特征提取，该模型通过在每个候选区域上应用Caffe CNN（卷积神经网络）得到4096维特征向量，227×227 的RGB图像，通过五个卷积层和两个全连接层前向传播来计算特征，节末链接中的论文解释的模型相对于PASCAL VOC 2012的先前结果实现了30％的改进。

R-CNN的一些缺点是：

训练是一个多阶段的任务，调整物体区域的卷积神经网络，使SVM（支持向量机）适应ConvNet（卷积网络）功能，最后学习边界框回归；
训练在空间和时间上都很昂贵，因为VGG16是占用大量空间的深层网络；
目标检测很慢，因为它为每个候选区域都要执行ConvNet前向传播。

你要的2019最全目标检测都在这里啦！相关推荐

CV模型，全目标检测等
CV视频全目标检测:https://www.bilibili.com/video/BV1zi4y137Xy?p=63
CVPR 2019 Oral | 京东目标检测算法ScratchDet的深入思考
本文为CVPR 2019 Oral ScratchDet算法的第一作者朱睿投稿,转载自作者公众号BringYourOwnVision,欢迎大家于文末右下角关注. 使用ImageNet预训练的网络模型能 ...
近20年最全目标检测综述
点击蓝字关注我们扫码关注我们公众号 : 计算机视觉战队扫码回复:目标检测,获取源码及论文链接 OBJECT DETECTION IN 20 YEARS 我们将从多个方面回顾对象检测的历史,包括里 ...
近20年最全目标检测综述（第二期）
点击蓝字关注我们扫码关注我们公众号 : 计算机视觉战队扫码回复:目标检测,获取源码及论文链接由于之前该推送没有署名论文作者相关信息,这次我们做了修改调整,给大家重新分享一次,希望能给需要的同学 ...
【视频课】超全目标检测课程！超30小时理论与4大案例实践，检测框架使用，长期更新中...
‍‍ 前言目标检测是计算机视觉和数字图像处理的一个热门方向,广泛应用于机器人导航.智能视频监控.工业检测.航空航天等诸多领域,通过计算机视觉减少对人力资本的消耗,具有重要的现实意义.因此,目标检测也 ...
最全目标检测相关资料整理 (目标检测+数据增强+卷价神经网络+类别不均衡...)
1 小目标检测: 综述: 综述论文Augmentation for small object detection 深度学习笔记(十)Augmentation for small object dete ...
边框回归的损失函数_CVPR 2019：精确目标检测的不确定边界框回归
本文由AI科技评论读者 BBuf 投稿来稿见文末说明大规模的目标检测数据集(例如MS-COCO)在进行Ground Truth框标注时仍然存在歧义.这篇论文提出了新的边界框回归损失针对目标框的移动 ...
2020年最全目标检测综述（完结篇）
点击蓝字关注我们 computerVision 计算机视觉战队 ● 扫码关注,回复:目标检测 ● 获取目标检测相关下载链接今天我们的目标检测综述最后一章,也是这个系列的完结,希望有兴趣的同学可以从中 ...
最新最全目标检测论文
object-detection 文章目录 object-detection Survey Papers&Codes R-CNN Fast R-CNN Faster R-CNN Mask R- ...

你要的2019最全目标检测都在这里啦！

你要的2019最全目标检测都在这里啦！相关推荐

最新文章

热门文章