1、通常的CNN网络结构如下图所示

图1

上图网络是自底向上卷积,然后使用最后一层特征图进行预测,像SPP-Net,Fast R-CNN,Faster R-CNN就是采用这种方式,即仅采用网络最后一层的特征。

以VGG16为例子,假如feat_stride=16,表示若原图大小是1000*600,经过网络后最深一层的特征图大小是60*40,可理解为特征图上一像素点映射原图中一个16*16的区域;那原图中有一个小于16*16大小的小物体,是不是就会被忽略掉,检测不到了呢?

结论:早起最常用的网络结构,缺点就是会造成检测小物体的性能急剧下降。

2、图片金字塔生成特征金字塔

鉴于上面的单层检测会丢失细节特征;就会想到利用图像的各个尺度进行训练和测试,比如下图所展示,将图像做成不同的scale,然后不同scale的图像生成对应的不同scale的特征

图2

将图片缩放成多个比例,每个比例单独提取特征图进行预测,这样,可以得到比较理想的结果,但是比较耗时,不太适合运用到实际当中。有些算法仅会在测试时候采用图像金字塔。

结论:在机器学习算法中经常使用,例如:HOG+SVM,但是它最大的缺点就是很耗时,很难应用于工程中。

3、多尺度特征融合的方式(特征金字塔)

图3

像SSD(Single Shot Detector)就是采用这种多尺度特征融合的方式,没有上采样过程,即从网络不同层抽取不同尺度的特征做预测,这种方式不会增加额外的计算量。作者认为SSD算法中没有用到足够低层的特征(在SSD中,最低层的特征是VGG网络的conv4_3),而在作者看来足够低层的特征对于检测小物体是很有帮助的。

结论:目前one-stage目标检测网络最常用的网络结构,对于小目标的检测,需要注意取到的较低层的特征,毕竟底层的特征包含更多的细节信息。

4、FPN(Feature Pyramid Networks)

图4

FPN主要解决的是物体检测中的多尺度问题,通过简单的网络连接改变,在基本不增加原有模型计算量的情况下,大幅度提升了小物体检测的性能。通过高层特征进行上采样和低层特征进行自顶向下的连接,而且每一层都会进行预测。

结论:借鉴了语义分割的思想,将上下层特征进行合并,进一步提升小物体检测率,在Anchor-free的目标检测网络中应用广泛。

5、top-down pyramid w/o lateral

图5

该网络有自顶向下的过程,但是没有横向连接,即向下过程没有融合原来的特征。实验发现这样效果比图1的网络效果更差。结论:效果之所以变差,主要因为目标的location特征在经过多次降采样和上采样过程后变得更加不准确。

6、only finest level

图6

上图带有skip connection的网络结构在预测的时候是在finest level(自顶向下的最后一层)进行的,简单讲就是经过多次上采样并融合特征到最后一步,拿最后一步生成的特征做预测,跟FPN的区别是它仅在最后一层预测。

结论:很显然,它没有在多个特征层进行predict,对多尺度目标鲁棒性不够好。

参考链接:https://blog.csdn.net/kk123k/article/details/86566954

目标检测:各种网络结构对比相关推荐

  1. 表现SOTA!DetCo算法:目标检测无监督对比学习

    点上方计算机视觉联盟获取更多干货 仅作学术分享,不代表本公众号立场,侵权联系删除 转载于:Sophia知乎 https://zhuanlan.zhihu.com/p/393398507 AI博士笔记系 ...

  2. 深度学习目标检测网络汇总对比,挺好的

    深度学习目标检测网络汇总对比 本文总阅读量次 欢迎star我的博客 2019-01-03 参考 :https://medium.com/@jonathan_hui/object-detection-s ...

  3. 【深度学习】ICCV2021|性能优于何恺明团队MoCo v2,DetCo:为目标检测定制任务的对比学习...

    作者丨小马 编辑丨极市平台 导读 作者专为目标检测任务"量身定制"了对比学习框架DetCo,在PASCAL VOC数据集上,DetCo在100个epoch时的性能就与MoCo V2 ...

  4. YOLOV5 的小目标检测网络结构优化方法汇总(附代码)

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 作者丨南山 来源丨 AI约读社 YOLOv5是一种非常受欢迎的单阶段目标检测,以其性能和速度著称,其结 ...

  5. Jetson Nano and VIM3硬件参数对比及目标检测性能对比

    文章目录: 1 Jetson Nano and VIM3硬件参数对比及目标检测性能对比 2 Jetson nano在yolov4目标检测性能 3 VIM在yolov3.yolov3-tiny.yolo ...

  6. CV之IS:计算机视觉之图像分割(Image Segmentation)算法的挑战任务、算法演化、目标检测和图像分割(语义分割/实例分割/全景分割)的对比

    CV之IS:计算机视觉之图像分割(Image Segmentation)算法的挑战任务.算法演化.目标检测和图像分割(语义分割/实例分割/全景分割)的对比 相关文章 CV之IS:计算机视觉之图像分割( ...

  7. 超越YOLOv5,1.3M超轻量,高效易用,目标检测领域这一个就够了!

    允中 发自 凹非寺 量子位 编辑 | 公众号 QbitAI 目标检测技术作为视觉技术届的顶梁柱,不仅单兵作战在人脸.车辆.商品.缺陷检测等场景有出色的表现,也是文本识别,图像检索.视频分析.目标跟踪等 ...

  8. 超越YOLOv5,1.3M超轻量,高效易用,目标检测领域这一个就够了

    简 介: 目标检测技术作为视觉技术届的顶梁柱,不仅单兵作战在人脸.车辆.商品.缺陷检测等场景有出色的表现,也是文本识别,图像检索.视频分析.目标跟踪等复合技术的核心模块,应用场景可谓比比皆是.各界开发 ...

  9. 基于改进SSD算法的小目标检测与应用

    人工智能技术与咨询 点击蓝字 · 关注我们 来源:< 计算机科学与应用> ,作者刘洋等 关键词: SSD:深度学习:小目标检测 摘要: 摘要: 针对通用目标检测方法在复杂环境下检测小目标时 ...

  10. 【深度学习】目标检测算法 YOLO 最耐心细致的讲解

    YOLO 是 2016 年提出来的目标检测算法,在当时比较优秀的目标检测算法有 R-CNN.Fast R-CNN 等等,但 YOLO 算法还是让人感到很新奇与兴奋. YOLO 是 You only l ...

最新文章

  1. 盘点几个开源的高仿项目,B站最像~
  2. TeamViewer 14 on Nvidia Jetson TX2
  3. python3下载教程-Python3 教程
  4. 在git中出现中文乱码的解决方案
  5. 胆战心惊形容什么_阿里员工感慨:加班累死累活,还胆战心惊,难道IT公司都这个样?...
  6. C++的常量折叠(一)
  7. plupload 中文php,简单集成wangEditor plupload 到Tp3.2
  8. Android工程中三种库的区别:Private Libraries、Referenced Libraries、Dependency Libraries
  9. h matlab,较优H圈matlab实现
  10. Python的安装以及编译器的安装
  11. 装ie9后无法用网银解决办法
  12. 细品慢酌QuickTest关键视图(1)
  13. HashTable与ConcurrentHashMap的区别
  14. 2018年传智博客黑马程序员python人工智能培训就业班视频下载
  15. TeraTerm SSH 登陆
  16. Moviepy自动化视频处理:添加音频、背景音乐,实现多轨音频
  17. Windows彻底删除驱动程序
  18. 技术前沿与经典文章22:继牛顿以后最伟大的物理学家——詹姆斯·克拉克·麦克斯韦
  19. PyTorch是什么?PyTorch有什么用?
  20. php 微信公众号开发,基于 PHP 的微信公众平台开发

热门文章

  1. c语言程序如下,某C语言程序如下: #include stdio.h void main() { floa.._简答题试题答案...
  2. 免费、强大的开源笔记软件Joplin综合评测 —印象笔记的开源替代
  3. 『前端大事记』之「几件大事」
  4. 在andriod手机上video视频播放时自动置顶自动全屏的问题
  5. 国内物联网平台(8):中移物联网开放平台OneNet
  6. 安装 office2007时出现:1706的错误-解决方案
  7. 七麦数据js爬虫(附代码)
  8. 怎么去掉微博图片中的水印,照片水印怎么去掉
  9. 关于死锁你了解多少,通过“让APP随手机壳改变颜色,程序员和产品经理大家”这一事,了解下死锁可好?
  10. [学习笔记]Min-25筛