转载请附链接,注明出处。

显著性对象检测综述

参考:http://mmcheng.net/zh/paperreading/

一、    程明明等人的论文:Salient Object Detection: A Surve(简单归纳了文章中的我认为比较重要的部分)

该论文旨在全面回顾突出显示目标检测的最新进展,并将其与其他密切相关领域(如通用场景分割,目标建议生成以及固定预测的显著性)相关联。主要内容涉及i)根源,关键概念和任务,ii)核心技术和主要建模趋势,以及iii)显著性物体检测中的数据集和评估指标。讨论并提出了未来的研究反向等开放性问题。

1.介绍

1.1 什么是显著性物体

提到一般认为,良好的显著性检测模型应至少满足以下三个标准:1)良好的检测:丢失实际显著区域的可能性以及将背景错误地标记为显著区域应该是低的;2)高分辨率:显著图应该具有高分辨率或全分辨率以准确定位突出物体并保留原始图像信息;3)计算效率:作为其他复杂过程的前端,这些模型应该快速检测显著区域。

1.3显著物体检测历史

(1)Itti等人提出的最早、经典的的显著模型。例如[24]一文掀起了跨认知心理学、神经科学和计算机视觉等多个学科的第一波热潮。

(2)第二波热潮由刘等人的[25],[55]和Achanta等人的[56]掀起,他们将显著性检测定义为二元分割问题,自此出现了大量的显著性检测模型。

(3)最近出现了第三波热潮,卷积神经网络(CNN)[69],特别是引入完全卷积神经网络[70]。与基于对比线索的大多数经典方法不同[1],基于CNN的方法消除了对手工特征的需求减轻了对中心偏见知识的依赖,因此被许多科研人员所采用。基于CNN的模型通常包含数十万个可调参数和具有可变感受野大小的神经元。神经元具有较大的接受范围提供全局信息,可以帮助更好地识别图像中最显著的区域。CNN所能实现前所未有的性能使其逐渐成为显著性物体检测的主流方向。

2. 现状调查

本节主要回顾三部分内容:1)显著性物体检测模型;2)应用;3)数据集。

2.1 经典模型(非常详细)

2.1.1 具有内在线索的基于块的模型

有两个缺点:1)高对比度边缘通常突出而不是突出物体;2)凸显物体的边界不能很好地保存。为了克服这些问题,一些方法提出基于区域来计算显著性。两个主要优点:1)区域的数量远少于区块的数量,这意味着开发高效和快速算法的潜力;2)更多的信息功能可以从区域中提取,领先以更好的表现。

2.1.2 具有内在线索的基于区域的模型(图4)

基于区域的显著性模型的主要优势:1)采用互补先验,以提高整体性能,这是主要优势;2)与像素和色块相比,区域提供更复杂的线索(如颜色直方图),以更好地捕捉场景的显著对象;3)由于图像中的区域数量远小于像素数量,因此在生成全分辨率显著图时,区域级别的计算显著性可以显著降低计算成本。

2.1.3 具有外部线索的模型(图5)

2.1.4 其他经典模型(图6)

局部化模型、分割模型、监督模式与无监督模式、聚合和优化模型

2.2 基于深度学习的模型

2.2.1 基于CNN(经典卷积网络)的模型

CNN大大降低了计算成本,多级特征允许CNN更好地定位检测到显著区域的边界,即使存在阴影或反射。但CNN特征的空间信息因为使用了MLP(多层感知器)而无法保留。

2.2.2 基于FCN(完全卷积网络)的模型

该模型具有保存空间信息的能力,可实现点对点学习和端到端训练策略,与CNN相比大大降低了时间成本。但在具有透明物体的场景、前景和背景之间的相同对比度以及复杂的背景等情况无法检测显著物体。

元素: PI=像素,PA=补丁,PE=区域,前缀m和h分别表示多尺度和分层版本。

假设: CP=中心先验,G=全局对比度,L=局部对比度,ED=边缘密度,B=背景先验,F=先验焦点,O=先验物体,CV=先验凸度,CS=中心环绕对比度,CLP=先验颜色,SD空间分布,BC=边界连通之前,SPS=稀疏噪声。

聚合/优化: LN=线性,NL=非线性,AD=自适应,RI=分层,BA=贝叶斯,GMRF=高斯MRF,EM=能量最小化,LS=最小二乘解

线索 :GT=地面真值注释,SI=相似图像,TC=时间线索,SCO=显著性实现,DP=深度,LF=光场。

对于显著性假设 : P=通用属性,PRA=预注意线索,HD=高维特征空间中的判别性,SS=显著性相似性,CMP=显著性提示的互补,SP=采样概率,MCO=运动相干性,RP=重复性,RS=区域相似度,C=相应,DK=领域知识。

其他 : CRF=条件随机场,SVM=支持向量机,BDT=提升决策树,RF=随机森林

4 数据集和评估措施

4.1 显著对象检测数据集

早期的带有包围框的突出物体图像:MSRA-A和MSRA-B

使用像素方式的二进制掩码来注释显著对象:ASD和DUT-OMRON

具有复杂和杂乱背景中的多个对象的数据集:[22]、[23]、[26]

4.2 评估措施(5个)

用S表示归一化为[0,255]的预测显著图,G是显著对象的地面正式二进制掩模

(1) 精确召回(PR)。首先将显著图S转化为二进制掩码M,然后通过将M与地面真值G进行比较来计算Precission和Recall:

(2) F值:通常Precission和Recall都不能完全评估显著图的质量,为此提出F值作为Precission和Recall的非负权重的集权跳河平均:

(3) ROC(Receiver Operating Characteristic)曲线:是以假正率(FP_rate)和假负率(TP_rate)为轴的曲线

(4)ROC曲线下面积(AUC):AUC越大性能越好

(5) 平均绝对误差(MAE):进行更全面的比较。

图12,比较流行的显著性对象检测数据集:

 

二、    传统显著性检测内容补充(论文中的分类和自己平时习惯不一致,所以重新收集资料整理了一下)

常用显著性检测方法:

1.  认知模型

几乎所有模型都直接或间接地受认知模型启发而来,其一大特点是与心理学和神经学相结合。Itti模型(使用三个特征通道:颜色、属性、方向)是这一类模型的代表,也是后来很多衍生模型的基础

2.  信息论模型

本质是最大化来自所处视觉环境的信息,其中最有影响力的模型是AIM模型。

3.  图论模型

基于图轮的显著性模型把眼动数据看成时间序列,使用了隐马尔科夫模型、动态贝叶斯网和条件随机场等方法。图模型可以对复杂的注意机制建模,因此能取得较好的预测能力,缺点在于模型的高复杂度,尤其涉及训练和可读性时。典型模型有:GBVS等

4.  频域模型

基于频谱分析的显著性模型,形式简洁,易于解释和实现,并且在注意焦点预测和显著区域检测方面取得了很大的成功,但其生物合理性不是非常清楚。经典模型有:频谱残差的显著性检测模型(纯数学计算方法)。

参考资料链接:

http://www.docin.com/p-915060851.html

http://www.doc88.com/p-4993561181219.html

http://blog.csdn.net/u012507022/article/details/52863461

 

三、    基于深度学习的显著性检测内容补充(论文是2014年所写,关于深度学习部分不够完善,因此在此又补充了一下)

基于深度学习的显著性目标检测研究发展初期从物体检测神经网络到OverFeat,一直难以取得理想的效果。2014年R-CNN的诞生成为第一个真正可以工业级应用的方案,其在VOC2007测试集的mAP提升至66%。但R-CNN框架仍然存在很多问题:

1) 训练分为多个阶段,步骤较为繁琐:微调网络+训练SVM+训练边框回归器

2) 训练耗时,占用磁盘空间大:5000张图片产生几百G的特征文件

3) 速度慢:使用GPU,VGG-16模型处理一张图像需要47s

截止目前,基于深度学习的显著性目标检测研究可以分为基于区域建议的深度学习目标检测基于回归的深度学习目标检测两个类别。

基于区域建议的深度学习目标检测方法有:R-CNN、SPP-net、FastR-CNN、Faster R-CNN、R-FCN等。

1) R-CNN(Regions with CNN features)重复计算,时间、空间代价较高;

2) SPP-net(Spatial Pyramid Pooling)强化了CNN的使用,允许输入大小不一致的图片,进一步强调了CNN特征计算前移、区域处理后移的思想,极大节省计算量,但不是端到端的模型且CNN特征提取没有联动调参数;

3) FastR-CNN的出现解决了前两者重复计算的问题,实现了区域建议到目标检测一端的卷积共享,首次提出的RoI Pooling技术极大地发挥区域后移的优势,加快了训练速度,采用VGG-16作为CNN网络模型,联动调用参数提升了实验效果,但是依然没有实现端到端的模型,对SS区域建议依赖严重;

4) Faster R-CNN弃用选择性搜索,提出了RPN网络来计算候选框,使用端到端的网络进行目标检测,无论在速度上还是在精度上,都得到了极大的提高,但在速度上并不能满足实时的需求,对每个建议分类计算量仍较大,功能上没有进入实例分割阶段。

基于回归的深度学习目标检测方法有:YOLO、SSD、G-CNN、NMS等。

1) YOLO(You Only Look Once)将目标检测任务转换成回归问题,大大简化了检测的过程、加快了检测的速度,但预测目标窗口时使用的是全局信息,冗余度高,且没有区域建议机制后检测精度不高;

2) SSDSingle ShotMultibox Detector)预测某个位置时使用的是该位置周围的特征,结合YOLO的回归思想以及FasterR-CNN中的候选区域机制,既保持了YOLO速度快的特性,也保证了精确定位;

3) G-CNN着力于减少初始化建议数量,使数以万计的建议变成极少的初始格网,提升了检测速度;

4) NMS(Non Maximum Suppression)则通过迭代的形式去除重复候选框,取置信率最大的框。

当前实际应用中,基于区域建议的深度学习目标检测使用更为广泛。

 

当前基于深度学习的显著性检测研究方法:

R-CNN系列显著性目标检测框架和YOLO显著性目标检测框架给了我们进行基于深度学习的目标检测两个基本框架。目前研究人员基于这些框架从其他方面入手提出一系列提高目标检测性能的方法。如:难样本挖掘、多层特征融合、使用上下文信息、更深网络学习的特征等。

(本来是熬了个夜准备组会的稿子~结果最后也没汇报成,有种换好衣服结果告诉我不用出门了,小失落~)

显著性检测综述(完整整理)相关推荐

  1. SaliencyReview:显著性检测综述阅读笔记

    typora-root-url: images SaliencyReviews 显著性检测论文综述阅读笔记 Author: wbzhang 2020/3/19 E-mail: wbzhang233@1 ...

  2. 显著性检测—学习笔记

    视觉显著性旨在模仿人类视觉系统选择视觉场景的某个子集的能力.而显著性物体检测(SOD)则侧重于检测场景中吸引最多注意力的物体,然后逐像素的提取物体的轮廓.SOD的优点在于它在许多计算机视觉任务中均有广 ...

  3. 视觉显著性python_OpenCV—python 图像显著性检测算法—HC/RC/LC/FT

    文章目录 一.显著性检测研究现状 二.基于谱残差法的显著性检测 三.基于全局对比度图像显著性检测(LC) 2.1 基于直方图对比度的显著性检测(HC) 2.2 基于区域的对比度方法(region-ba ...

  4. python视觉识别_视觉显著性python_OpenCV—python 图像显著性检测算法—HC/RC/LC/FT

    文章目录 一.显著性检测研究现状 二.基于谱残差法的显著性检测 三.基于全局对比度图像显著性检测(LC) 2.1 基于直方图对比度的显著性检测(HC) 2.2 基于区域的对比度方法(region-ba ...

  5. [OpenCV实战]47 基于OpenCV实现视觉显著性检测

    人类具有一种视觉注意机制,即当面对一个场景时,会选择性地忽略不感兴趣的区域,聚焦于感兴趣的区域.这些感兴趣的区域称为显著性区域.视觉显著性检测(Visual Saliency Detection,VS ...

  6. 【时间序列异常检测】时序异常检测综述整理(2020-2021)

    转载:宅码 最近阅读几篇异常检测综述,这里整理分享给大家,推荐阅读:5星.不足之处,还望批评指正. 赵越博士的异常检测库Python Outlier Detection (PyOD) [1]写的很好, ...

  7. 图像显著性检测和图像检索的标准图像库整理

    一直以来做图像显著性检测和图像检索的相关研究,避免不了需要找相关的图像库来进行算法验证.今天把一些标准图像库整理如下: 显著性检测图像库 (1)MSRA-1000 (2)MSRA-10K 上述两个图像 ...

  8. 目标检测综述——单阶段检测器

    文章目录 一.SSD((Single Shot MultiBox Detector)) 1.Default box 2.训练过程 3.数据增强 4.其他变体 (1)DSSD (2)DSOD (3)FS ...

  9. 显著性检测数据集之——眼动预测

    本文收集的显著性检测数据集包含两个部分:人眼关注点预测数据集(fixation prediction datasets)和显著物体检测数据集(salient object detection data ...

  10. 2022目标检测综述

    目录 0.引言 1.背景 1.1.问题描述 1.2.目标检测的核心问题 1.3.目标检测中的关键挑战 2.关于损失函数 3.关于IOU 4.数据集以及评价指标 4.1.评价指标 4.2.数据集 5.目 ...

最新文章

  1. 宁‘内卷‘,勿‘躺平‘
  2. win10组件服务计算机是红色的,KB4023057:Windows 10更新服务组件的更新
  3. 解决appium安装app时某些手机弹出的提示框
  4. 渐进式app_如何编写渐进式Web App新闻网站
  5. 大幅广告显示隐藏效果
  6. 携程启动“2021混合办公试验”,梁建章:拥抱疫情之外的在家办公
  7. 愤怒的小鸟,弹弓效果
  8. 没有计算机基础可以学python-要学 Python 需要怎样的基础?
  9. Raki的读paper小记:FastText:Enriching Word Vectors with Subword Information
  10. JavaScript实现汉字转拼音功能
  11. 二倍图三倍图什么意思_iOS 2倍图 3倍图适配小结
  12. ECU存储安全之存储器安全
  13. 在excel中如何筛选重复数据_Excel重复数据不会筛选?方法其实很简单!
  14. FPD-LINK网上搜集的相关资料链接(持续更新)
  15. 如果当初投10000买iPhone股票 现在能赚81部iPhoneX
  16. java移位运算符详解
  17. 求最小公倍数【牛客网】
  18. 基于 FFMPEG 的像素格式变换(swscale,致敬雷霄骅)
  19. 微信分享打不开分享界面
  20. 逆向工程---IA32寄存器

热门文章

  1. 通过STM32CubeMX实现LED闪烁——基于HAL库
  2. 小米6内存测试软件,小米6采用的是eMMC还是UFS2.1?来测试一下吧
  3. echarts 北京公交线路-线路效应
  4. Keil出现“File has been changed outside the editor, reload?”提示
  5. org.apache.jasper.servlet.TldScanner.scanJars At least one JAR was scanned f
  6. 作业必备:操作系统实验四【软中断通信】
  7. php 5.0入门系列教程 pdf,thinkphp5.0基础视频教程
  8. 到底什么是BFC、IFC、GFC和FFC,次奥?
  9. debian8.7 下配置fai机环境
  10. 嵌入式技术学习路线摘要