目标检测近5年发展历程概述,从R-CNN到RFBNet(2013--2018)(转)

2018年09月24日 12:32:02 C小C 

【时间】2018.09.24

【题目】目标检测近5年发展历程概述,从R-CNN到RFBNet(2013--2018)

目录

概述

一、目标检测相关背景

1.1 目标检测的类别

1 .2 目标检测遇到的主要难题

1.3 过去二十年的进展

二、 框架

2.1框架发展历程

2.2一些里程碑式的框架

三、基础性子问题

3.1 基于 DCNN 的目标表示

3.2 形境建模

3.3 检测提议 (detection proposal)方法

3.4  训练策略和处理类别不平衡问题

四、数据集和表现评估

4.1用于目标识别的常用数据库

4.2常用指标汇总

五、总结


概述

今天,看到了《Deep Learning for Generic Object Detection: A Survey》这一篇论文, 对用于一般目标检测的深度学习技术进行了全面系统的总结。本文是对论文的相关内容的梗概,希望以此作为自己在目标识别方面的学习历程和方向的指引。本文主要作为各种相关知识的索引,如若想要了解相关细节,请阅读原文,或者通过此索引获得关键词,再进行相关内容的搜索。

论文链接:https://arxiv.org/abs/1809.02165

此外,来自首尔国立大学的 Lee hoseong 在近期开源了「deep learning object detection」GitHub 项目,正是参考该论文开发的。项目链接是: https://github.com/hoya012/deep_learning_object_detection#2014

一、目标检测相关背景

1.1 目标检测的类别

一般目标检测(即一般目标类别检测)也被称为目标类别检测 [240] 或目标分类检测,其定义如下。给定一张图像,确定其中是否存在多个预定义类别的任何目标实例;如果存在,就返回每个实例的空间位置和覆盖范围。

图3、与通用目标检测相关的识别问题(A)图像级对象分类,(B)包围框级通用对象检测,(C)像素级语义分割,(D)实例级语义分割。

1 .2 目标检测遇到的主要难题

图5。同一类图像的外观随成像条件的变化而变化(a-g)。一个对象类(H)的含义有一个惊人的变化。相反,(I)中的四幅图像看起来非常相似,但实际上是来自四种不同的对象类别。来自ImageNet[179]和Coco女士[129]的图像。

1.3 过去二十年的进展

图2、目标检测和识别的里程碑,包括特征表示 [37, 42, 79, 109, 114, 139, 140, 166, 191, 194, 200, 213, 215]、检测框架 [56, 65, 183, 209, 213] 和数据集 [53, 129, 179]。在 2012 年之前,主导方法都还是人工设计的特征。我们看到,随着 Krizhevsky et al. [109] 为图像分类开发出了 DCNN,2012 年迎来了转折。这里列出的大多数方法都得到了大量引用并至少赢得了一个 ICCV 或 CVPR 的主要奖项。详见 2.3 节。

二、 框架

2.1框架发展历程

在这一节,我们会回顾一般目标检测领域在深度学习进入这一领域后出现的里程碑检测框架,如图 6 所示, 详细情况总结在表 10 中(请看原论文最后一页)。整体而言,这些检测器可以分为两大主要类别:

1. 两级式检测框架,包含一个用于区域提议的预处理步骤,使得整体流程是两级式的。

2. 单级式检测框架,即无区域提议的框架,这是一种单独提出的方法,不会将检测提议分开,使得整个流程是单级式的。

图 6:一般目标检测的里程碑,基于第一个 arXiv 版本的时间点

2.2一些里程碑式的框架

图 7:里程碑检测框架 RCNN [65, 67] 的细节图示

图 8:用于一般目标检测的领先框架的高层面示意图。表 10 总结了这些方法的特性。

三、基础性子问题

3.1 基于 DCNN 的目标表示

作为任何测器的主要组件之一,优良的特征表示在目标检测中至关重要。

          

表 2:常用于一般目标检测的 DCNN 架构。对于 #Paras 和 #Layers 的统计数据,我们没有考虑最后的 FC 预测层。「Test Error」一列给出了在 ImageNet1000 上的 Top 5 分类测试误差。解释:OverFeat(准确的模型)、DenseNet201(Growth Rate 32, DenseNet-BC)以及 ResNeXt50(32*4d)。

表 3:在改进用于一般目标检测的 DCNN 特征表示中的表征方法的特性总结。详细讨论参见 4.1.2 节。缩写:Selective Search(SS)、EdgeBoxes(EB)、InceptionResNet(IRN)。mAP@IoU=0.5 时,在 VOC07、VOC12 和 COCO 上报告的检测结果;另一列在 COCO 上的结果是在一个新指标 mAP@IoU=[0.5 : 0.05 : 0.95] 上报告的,这是在从 0.5 到 0.95(写成 [0.5:0.95])的不同 IoU 阈值上平均求取 mAP。训练数据:07 表示 VOC2007 trainval,12 表示 VOC2012 trainval,07+12 表示 VOC07 和 VOC12 trainval 的并集,07++12 表示 VOC07 trainval、VOC07 test 和 VOC12 trainval 的并集,07++12+CO 表示 VOC07 trainval、VOC07 test、VOC12 trainval 和 COCO trainval 的并集。COCO 检测结果是在 COCO2015 Test-Dev 上报告的,只有 MPN [233] 除外,其结果基于 COCO2015 Test-Standard。

3.2 形境建模

在物理世界中,视觉目标通常会出现在特定的环境中,并且通常与其它相关目标共同存在,而且有强大的心理学证据 [13, 9] 表明形境在人类目标识别中发挥着关键性的作用。形境大致可分为这三大类 [13, 59]:

1. 形义形境:目标出现在某些场景而非其它场景中的可能性;

2. 空间形境:在场景中目标与其它物体存在某些位置关系而非其它位置关系的可能性;

3. 尺寸形境:在场景中目标相对其它物体所存在的尺寸限制。

表 4:使用了形境信息的检测器汇总,类似表 3

图 13:能探索局部周围形境特征的代表性方法:MRCNN [62]、GBDNet [235, 236]、ACCNN [123] 和 CoupleNet [251],参见表 4

3.3 检测提议 (detection proposal)方法

检测提议(detection proposal)通常被用作一个预处理步骤,以通过限制需要检测器评估的区域的数量来降低计算的复杂性。一个优良的检测提议应当具备以下特点:

1. 高召回率,只使用少量提议就可以实现;

2. 提议尽可能准确地匹配目标;

3. 高效率。

表 5:使用 DCNN 的目标提议方法汇总。蓝色数字表示目标提议的数量。除非另有说明,在 COCO 上的检测结果都使用了 mAP@IoU[0.5, 0.95]。

图 14:[175] 中提出的区域提议网络(RPN)图示

3.4  训练策略和处理类别不平衡问题

四、数据集和表现评估

4.1用于目标识别的常用数据库

表 7:用于目标识别的常用数据库

图15、常用数据库的一些例子

4.2常用指标汇总

表 9:用于评估目标检测器的常用指标汇总

五、总结

一般目标检测是计算机视觉领域内一个重要且有挑战性的问题,并且已经得到了相当大的关注。尽管过去几年取得了巨大的成功(比如检测准确度从 ILSVRC2013 的 23% 显著提升至了 ILSVRC2017 的 73%),但当前最佳方法的表现与人类水平仍有巨大差距,尤其是在开放世界学习任务上。还有很多研究工作有待完成,我们可以看到研究者的关注重点主要集中在以下八个领域:

1. 开放世界学习( Open World Learning)

2. 更好更高效的检测框架(Better and More Efficient Detection Frameworks)

3. 紧凑高效的深度 CNN 特征(CompactandEfficientDeepCNNFeatures)

4. 稳健的目标表征(RobustObjectRepresentations)

5. 形境推理( Context Reasoning)

6. 目标实例分割( Object Instance Segmentation)

7. 弱监督或无监督学习() Weakly Supervised or Unsupervised Learning)

8. 三维目标检测(3D Object Detection)

转载于:https://www.cnblogs.com/ciao/articles/10892921.html

目标检测近5年发展历程概述(转)相关推荐

  1. 目标检测之one-stage模型发展总结

            由于广泛的应用和技术上的突破,目标检测(object detection)在近些年吸引了越来越多的注意力,以飞快的速度发展着.在导致目标检测领域飞速发展的众多因素中,深度卷积神经网络和 ...

  2. 目标检测算法回顾之发展概览

    目标检测算法的发展时间线 发展历史轴(时间轴线图) 算法方法概览(思维导图) 说明:本文仅供学习 发展历史轴(时间轴线图) 目标检测的算法发展可以追溯到很久之前,这里我根据前两年的综述论文加上这两年的 ...

  3. 表格检测识别技术的发展历程

    近年来,随着计算机技术的飞速发展,越来越多的研究者开始关注表格检测识别技术.表格检测识别技术是一种利用计算机自动处理表格的技术,它可以实现从文本中检测出表格,并进行识别和提取.这种技术有助于提高文本处 ...

  4. 如何评价Sparse R-CNN,目标检测未来会如何发展?

    链接:https://www.zhihu.com/question/431890092 编辑:深度学习与计算机视觉 声明:仅做学术分享,侵删 作者:信息门下添狗 https://www.zhihu.c ...

  5. 导航系统的工作方式及其发展历程概述

    导航就是将运载体按照预定的航线从起始位置引导到目的地的过程.导航技术是随着人类的经济.军事.政治发展需求而发展起来的,并且随着其需求的提升,也对导航定位技术不断的提出了新的需求.导航的过程中首先需要定 ...

  6. 【技术白皮书】第二章:文本检测与识别技术发展历程

    文本识别 俗称光学字符识别,英文全称是Optical Character Recognition(简称OCR),它是利用光学技术和计算机技术把印刷体或手写体文本进行读取识别,转化成计算机和人都能够识读 ...

  7. 论文笔记:Object Detection in 20 Years: A Surve(目标检测20年研究综述)

    文章目录 1.介绍 2.目标检测的20年发展历程 2.1.目标检测路线 2.1.1.里程碑:传统检测器 2.1.2.基于CNN的两阶段检测器 2.1.3.基于CNN的单阶段检测器 2.2.目标检测数据 ...

  8. 人工智能目标检测模型总结(一)——R-CNN、Fast R-CNN、Faster R-CNN

    前言 目标检测是人工智能的一个重要应用,就是在图片中要将里面的物体识别出来,并标出物体的位置,一般需要经过两个步骤: 1.分类,识别物体是什么 2.定位,找出物体在哪里 除了对单个物体进行检测,还要能 ...

  9. 【目标检测_概述】recent advances in deep learning for object detection_2019

    文章目录 Abstract 1.Introduction 2. Problem Setting 3.Detection Components 3.1 Detection Settings 3.2 De ...

最新文章

  1. oracle600错误,oracle在导入数据时报600错误的解决方法
  2. 【学习笔记】mysql多实例安装
  3. 计组(唐朔飞)第一章自我总结
  4. 每日程序C语言48-字符串排序
  5. 【Chrome浏览器】常用快捷键整理
  6. CentOS7下NextCloud搭建
  7. 一名待业小生亲身调研揭秘10家大数据培训机构“内幕”
  8. python 完全背包问题_经典动态规划:完全背包问题
  9. python整蛊代码+详解
  10. MongoDB 3.4安装及配置
  11. 双线一柱变色MACD指标
  12. 深度学习-2.机器学习基础
  13. ECharts: 绘制立体柱状图【圆柱体】
  14. 全网最详细最基础的网络安全入门教程
  15. linux 极路由救砖,极路由救砖方法?
  16. 7-32 哥尼斯堡的“七桥问题”(25 分)
  17. Python常用模块-1
  18. 西门子plm_历年中国工业软件营收十强厂商:华为、西门子稳居前二名
  19. git am 冲突解决技巧
  20. 快手2020春季实习生及校招补招程序B卷

热门文章

  1. python语句中对象未被定义_python 形参没有被定义???感觉遇到鬼了。。。
  2. 第二次实验报告(漏)
  3. elasticsearch 问题
  4. HDU 6064 RXD and numbers
  5. 首页列表显示全部问答,完成问答详情页布局
  6. H.264学习--1
  7. Java基础知识强化之集合框架笔记27:ArrayList集合练习之去除ArrayList集合中的重复字符串元素...
  8. HDU1232——通畅工程(并查集)
  9. oracle用户权限的管理
  10. IIS不能发布asp.net 应用程序