目标检测算法综述(近20年)
目标检测最新总结文献 :
1《Deep Learning for Generic Object Detection A Survey》 下载地址
2.《Object Detection in 20 Years: A Survey》下载地址
GitHub:下载地址
目标检测是将图像或者视频中的目标与其他不感兴趣区域进行区分,判断是否存在目标,确定目标位置,识别目标种类的计算机视觉任务。
以AlexNet为分界线,2012年之前为传统算法,2013年之后为深度学习算法。
一、目标检测传统算法
包括:
``
1、Viola-Jones算法
2、HOG 特征算法
3 DPM 模型
``
二、 基于深度神经网络的目标检测与识别
2012年, Hinton教授的团队利用卷积神经网络设计了AlexNet,在ImageNet数据集上打败所有传统方法的团队,使得CNN成为计算机视觉领域中最为重要的工具。
基于深度学习的目标检测算法大致分为三类:
1、基于区域建议的算法 如,R-CNN、 Fast R-CNN、Faster R-CNN等。
2、基于目标回归的检测算法,如YOLO、SSD,retinanet,EfficientDet。
3、基于搜索的目标检测与识别算法, AttentionNet,强化学习。
4、基于Anchor-free的算法,如 CornerNet,CenterNet,FCOS 等。
网络性能比较如下:
1.R-CNN 论文地址
局限性:
1.目标候选区域的重叠使CNN特征提取存在很大冗余
2.Fast R-CNN 论文地址
- Fast R-CNN直接将图像归一化后接CNN,然后在最后一层特征图上增加区域建议框,相比R-CNN要将每个区域建议框使用CNN提取特征要节省很多计算量
- R-CNN 在SVM分类之前,把CNN提取的特征存储在硬盘上,读写速度慢造成训练耗时大。Fast R-CNN将训练数据在GPU上直接使用Softmax分类,不需要将大量数据存储在硬盘上
3.Faster R-CNN 论文地址
主要思想:
1.Faster R-CNN 目标检测分为4个部分(候选区域生成,特征提取,分类,和Bounding box回归)
2.候选区域由RPN完成,其它三个部分沿用Fast R-CNN
4.YOLO v1 论文地址
缺点:
1.定位精度差,没有区域建议算法高,主要由于该算法对图像做回归而不是滑动窗口检测
2.对小目标,或目标之间位置接近的情况下检测效果不好
主要思想:
1.将整个图像分成S*S个格子
2.将整张图像送入CNN,预测每一个格子是否存在目标、(预测目标边界框和目标的类别)
3.将预测的边界框做非最大值抑制(NMS),得到最终结果。
5.SSD 论文地址
算法流程:
1.通过CNN提取整个图像特征
2.针对不同尺度的深度特征图设计大小不同的特征提取框
3.特征提取框预测目标类别和真实边界
4.NMS筛选最佳预测结果。
6.R-FCN [论文地址]
- 输入一张图到CNN网络
- 经过与预练网络网络后,在最后一个卷积层存在有3个分支,第一个是在feature map上面做RPN网络,得到相应的区域建议框(ROI),第二个分支是在改feature map上得到一个 K2(C+1)K^2(C+1)K2(C+1)维向量做分类,第三个分支在feature map上得到4K24K^24K2个向量用作Bounding Box回归
- 在 K2(C+1)K^2(C+1)K2(C+1)和4K24K^24K2两个score map上分别执行position-sensitive pooling 获得最终的类别和位置信息
7.YOLO v2 论文地址
- YOLO与Fast R-CNN的误差分析表明,YOLO V1 存在大量的定位误差。此外,与基于区域建议的方法相比,YOLO的召回率相对较低。 YOLO v2 则提出在保持分类精度的同时提高召回率和定位精度。
- 在YOLO V2中对所有卷积层添加批量归一化(Batch Normalization),mAP中得到了2%以上的改进。批处理规范化还有助于对模型进行规范化。
- 原YOLO V1以224×224训练分类器网络,YOLO v2 的分类网络以 448*448 的分辨率先在 ImageNet上进行微调,微调 10 个 epochs,让网络有时间调整滤波器(filters),好让其能更好的运行在新分辨率上,还需要调优用于检测的 Resulting Network。最终通过使用高分辨率,mAP 提升了 4%。
- YOLO V1包含有全连接层,从而能直接预测 Bounding Boxes 的坐标值。 Faster R-CNN 的方法只用卷积层与 Region Proposal Network 来预测 Anchor Box 偏移值与置信度,而不是直接预测坐标值。作者发现通过预测偏移量而不是坐标值能够简化问题. YOLO V2去掉了全连接层,使用 Anchor Boxes 来预测 Bounding Boxes。作者去掉了网络中一个池化层,这让卷积层的输出能有更高的分辨率
- Anchor Box 的尺寸是手动选择的,还有优化的余地。 为了优化,在训练集的 Bounding Boxes 上使用 k-means聚类,来找到一个比较好的值。
- 网络使用一个 Logistic Activation 来对于网络预测结果进行限制,让结果介于 0 到 1 之间。
8.YOLO v3 论文地址
9. M2DNeT: 论文地址
代码
提出了多层次的特征金字塔网络(MLFPN)来构造更有效的特征金字塔来检测不同尺度的目标
【RetinaNet】Focal Loss for Dense Object Detection 博客--------
【CornerNet】博客
【CenterNet】 博客
【FCOS】 博客
【EfficientDet】 博客
目标检测算法综述(近20年)相关推荐
- 基于深度学习的目标检测算法综述(从R-CNN到Mask R-CNN)
深度学习目标检测模型全面综述:Faster R-CNN.R-FCN和SSD 从RCNN到SSD,这应该是最全的一份目标检测算法盘点 基于深度学习的目标检测算法综述(一) 基于深度学习的目标检测算法综述 ...
- 病虫害模型算法_基于深度学习的目标检测算法综述
sigai 基于深度学习的目标检测算法综述 导言 目标检测的任务是找出图像中所有感兴趣的目标(物体),确定它们的位置和大小,是机器视觉领域的核心问题之一.由于各类物体有不同的外观,形状,姿态,加上成像 ...
- 3D单目(mono 3D)目标检测算法综述
layout: post title: 3D单目(mono 3D)目标检测算法综述 date: 2021-01-22 22:08:39.000000000 +09:00 categories: [算法 ...
- 一文尽览 | 基于点云、多模态的3D目标检测算法综述!(Point/Voxel/Point-Voxel)
点击下方卡片,关注"自动驾驶之心"公众号 ADAS巨卷干货,即可获取 点击进入→自动驾驶之心技术交流群 后台回复[ECCV2022]获取ECCV2022所有自动驾驶方向论文! 目前 ...
- 目标检测算法综述 | 基于候选区域的目标检测器 | CV | 机器视觉
目标检测算法综述 | 基于候选区域的目标检测器 | CV | 机器视觉 滑动窗口检测器 自从 AlexNet 获得 ILSVRC 2012 挑战赛冠军后,用 CNN 进行分类成为主流.一种用于目标检测 ...
- 基于深度学习的目标检测算法综述(一)
基于深度学习的目标检测算法综述(一) 基于深度学习的目标检测算法综述(二) 基于深度学习的目标检测算法综述(三) 本文内容原创,作者:美图云视觉技术部 检测团队,转载请注明出处 目标检测(Object ...
- 基于深度学习的目标检测算法综述(二)
转自:https://zhuanlan.zhihu.com/p/40020809 基于深度学习的目标检测算法综述(一) 基于深度学习的目标检测算法综述(二) 基于深度学习的目标检测算法综述(三) 本文 ...
- 红外弱小目标检测算法综述
红外弱小目标检测算法综述 ------ 参考文献: 李俊宏,张萍,王晓玮,黄世泽.红外弱小目标检测算法综述[J].中国图象图形学报,2020,25(09):1739-1753. ------ 依据是否 ...
- 基于深度学习的目标检测算法综述
其它机器学习.深度学习算法的全面系统讲解可以阅读<机器学习-原理.算法与应用>,清华大学出版社,雷明著,由SIGAI公众号作者倾力打造. 书的购买链接 书的勘误,优化,源代码资源 导言 目 ...
- 目标检测算法综述—— One-Stage方法
目录 1.概述 2.目标检测算法 2.1.SSD 2.2.DSSD 2.3.YOLO V1 2.4.YOLO V2 2.5.YOLO V3 2.6.RetinaNet 研究背景 主要贡献 二分类的交叉 ...
最新文章
- Redis的多种启动方式比较!
- 收集的一些主流网站的GA代码
- APPLE:疑问驱动下的学习与实践
- angular Ng-Zrro树形控件 异步加载
- superset出现unhashable type: ‘dict‘
- Orchard之生成新模板
- BFC与边距重叠详解
- android短信安全,基于Android短信服务的手机安全监控系统的设计与实现
- 学习笔记1:迟滞电压比较器
- linux 修改网卡 mac地址命令,Centos系统下查看和修改网卡Mac地址(附ifconfig命令格式)...
- 2cm有多长实物图_2cm(2cm有多长实物图)
- jupyter报错EnvironmentLocationNotFound: Not a conda environment: /root/anaconda3/envs/anaconda3
- Ogre 使用声音最简单的方法
- python量化股票源码_使用Python写一个量化股票提醒系统
- Zabbix agent2安装
- python_pandas入门(by offical document/reference)/loc和iloc操作/dataframe插入操作/pandas读取无表头的文件/查找某一列是否有某个值
- Smt贴片加工出现元件立碑的解决方法
- iOS 自动续期订阅,订阅升级降级、订阅时间、退收费处理
- Vue项目中ico问题
- 云存储系统服务器版安装,云存储系统服务器版安装