如我之前的回答目标检测领域还有什么可以做的?​www.zhihu.com

基于深度学习的目标检测场景下的目标多尺度变化是未来一段时间内比较核心的问题。就这个问题,下面我介绍一些目前存在的主流研究方向论文以供大家参考。

1.小目标问题,解决这个问题比较经典的文章是Perceptual Generative Adversarial Networks for Small Object Detection。这是CVPR2017的paper,主要针对small object detection的一篇文章,采用PGAN来提升small object detection任务的performance。据我所知也是较早的一篇将GAN用于small object的顶会文章。关于这篇文章的问题分析可以看这个问题如何评价CVPR2017: PGAN for Small Object Detection?​www.zhihu.com

后续的相关研究,由于我方向不是这个,就没有再关注了。当然小目标问题一直是一个比较不错的研究方向。

同时目标检测的尺度变化问题,是目前我关注的一个重要方向。下面我就详细的说一下目前的目标检测多尺度变化的主流解决方案。

2.最早的一个解决尝试是UC San DiegoSVCL实验室和IBM研究院的MSCNN:A Unified Multi-scale Deep Convolutional Neural Network for Fast Object Detection。这篇文章发表在ECCV2016,项目参考地址为zhaoweicai/mscnn 。这篇主要解决多尺度同时存在时的结案所问题。提出了两点创新,1)针对多尺度问题,采用类似于FCNT跟踪方法,该文章也是观察到了卷积网络不同层得到的特征特点的不同,对不同层的特征采用不同的利用方式。比如conv-3的低网络层,有更小的感受野,可以进行小目标的检测;而高层如conv-5,对于大目标的检测更加准确。对于不同的输出层设计不同尺度的目标检测器,完成多尺度下的检测问题。2)针对速度问题,使用特征的上采样代替输入图像的上采样步骤。设计一个去卷积层,来增加特征图的分辨率,使得小目标依然可以被检测出来。这里使用了特征图的deconvolutional layer(去卷积层)来代替input图像的上采样,可以大大减少内存占用,提高速度。文章的网络结构类似RCNN,分为proposal提取和目标检测,两个部分独立进行。

3.STDN: Scale-Transferrable Object Detection,这篇文章发表在CVPR2018,这篇文章提出了一个STDN网络用语多目标检测效果的提升。本文采用了类似SSD的结构主要包括:1)实用DenseNet-169作为基础网络将高低层特征融合达到类似FPN的效果,2)提出Scale-Transfer Module,在几乎不增加参数量和计算量的情况下生成大尺度的feature map。通过DenseNet提取特征在最后一个Dense Block获得一系列9*9大小的feature map,然后通过Scale-transfer Module对feature map进行放大或缩小。最后分别对不同尺度的feature map做目标检测。

4.An Analysis of Scale Invariance in Object Detection – SNIP ,这篇也是CVPR2018的文章。这篇文章想探讨的是Scale变化对识别和检测的影响,然后就是upsample对于小物体的检测是否有用。根据这两个问题的分析,本文提出了一种端到端的Image Pyramid Network,然后针对大物体在大尺度的图片上、小物体在小尺度的图片上不易识别的问题,提出了一种新颖的训练策略Scale Normalization。这篇文章我觉得最重要的就是把目标检测的多尺度问题进行了进一步的分析,有兴趣的可以看一下细节。

5.SNIPER: Efficient Multi-Scale Training ,这篇文章发布在NIPS2018,项目地址为mahyarnajibi/SNIPER。RCNN本身具有很好的尺度不变形,因为它先从图片中提取proposal,然后都resize到224去提取特征但是这样每个proposal不共享特征的计算,很慢,而Fast系列为了解决这个问题,输入大小不固定,不同尺度的图片都经过同一个的cnn提取特征然后拿proposal去对应位置扣特征,这就破坏了RCNN原来的尺度不变形,但是它很快且整体做特征提取能捕捉更多的context,得到广泛的应用。现在大家为了解决Fast系列的问题,往往进行多尺度的训练。RCNN中只对扣出来的proposal进行放缩,小的proposal会放大,合适的proposal就会不怎么变,太大的proposal会放小,总之都会resize到一个固定的尺度,检测网络只用适应这一种尺度,而Fast系列多尺度训练时,不管图片中的proposal大还是小都要跟着图片整体做放大或者缩小,这样检测网络还是去适应这些尺度,而且上一篇中引用Naiyan Wang的说法: 这更多是通过CNN来通过capacity来强行memorize不同scale的物体来达到的,这其实浪费了大量的capacity。上一篇的SNIP是忽略掉大图中的大proposal和小图中的小proposal,也就是把一些极端的情况都忽略掉,相对来说只保留了尺度大致一致(和Imagenet的预训练模型的尺度差不多)的proposal参与训练,但是它也有个缺点就是训练太慢了,每个尺度的图片的每个像素都要参与训练。综上本文提出一种SNIPER的方法,通过生成scale specific context-regions,本文叫做chip,生成多个尺度的chips,不管是哪个尺度都采样到512x512,这样既保留RCNN的尺度不变性和Fast系列的速度,也由于过滤到了很大一部分背景而比SNIP快很多。

6.Scale-Aware Trident Networks for Object Detection 这篇是图森Naiyan Wang的TridentNet ,这篇文章的创新点我可以在这里说一下,主要是基于感受野的控制来实现多尺度目标的检测,本文通过三个branch来实现多尺度目标的感受野,三个branch共享权重,感受野的大小通过dilation rate来控制,同时通过scale aware training 的方式来过了三个branch的检测。具体的可以看作者的知乎文章Naiyan Wang:TridentNet:处理目标检测中尺度变化新思路​zhuanlan.zhihu.com

当然这篇文章还没有会议录用处于刚刚发布阶段。

以上是我接触到的一些关于解决目标尺度问题的最新解决方案,欢迎大家一起探讨。另外不接受伸手党,问我要idea的私信,谢谢合作。

深度学习aps_深度学习的目标检测算法是如何解决尺度问题的?相关推荐

  1. 目标检测YOLO实战应用案例100讲-基于深度学习的无人机航拍图像目标检测算法研究与应用

    目录 基于深度学习的无人机航拍图像目标检测算法研究与应用 基于深度学习的目标检测相关知识理论

  2. 目标检测YOLO实战应用案例100讲-基于深度学习的水下图像增强及目标检测算法研究与应用

    目录 基于迁移学习的水下图像增强与目标检测研究 基础知识 2.1  迁移学习

  3. 3目标检测的准确率_吊打YOLOv3!普林斯顿大学提出:CornerNetLite,基于关键点的实时且精度高的目标检测算法,已开源!...

    点击上方"CVer",选择"星标"和"置顶" 重磅干货,第一时间送达 前戏 最近目标检测方向,出了很多很棒的paper,CVer也立即跟进报 ...

  4. 深度学习之目标检测(一)—— 目标检测算法介绍

    目标检测问题 目标检测是在图片中对可变数量的目标进行查找和分类 查找就是定位到它在图片中的位置,通常表示为一个矩形框 对于这样的问题,主要存在三个主要难点 ①目标种类与数量问题 ②目标尺度问题 ③外在 ...

  5. 它来了,它来了,最强目标检测算法YOLO v4,它真的来了!!!

    YOLO 之父 Joseph Redmon 宣布退出计算机视觉领域,此事引发了极大的热议,其中一个悬念就是:我们还能等到 YOLO v4 吗? 现在,这一目标检测神器出现了新的接棒者!YOLO 的官方 ...

  6. 双目立体视觉建立深度图_从单幅图像到双目立体视觉的3D目标检测算法

    原创声明:本文为 SIGAI 原创文章,仅供个人学习使用,未经允许,不能用于商业目的. 其它机器学习.深度学习算法的全面系统讲解可以阅读<机器学习-原理.算法与应用>,清华大学出版社,雷明 ...

  7. 卷积网络应用于目标检测算法

    简 介: 目标检测算法作为计算机视觉领域最基本且最具挑战性的任务之一,一直处于研究的热门领域.近年来,随着深度学习和卷积神经网络的兴起,传统的目标检测算法的性能已不能满足现今的指标要求而被基于卷积网络 ...

  8. 基于激光雷达点云的3D目标检测算法论文总结

    作者丨eyesighting@知乎 来源丨https://zhuanlan.zhihu.com/p/508859024 编辑丨3D视觉工坊 前言  过去很多年激光雷达的车规标准和高昂价格是阻碍其量产落 ...

  9. 目标检测算法SSD结构详解

    ❝ 上期我们一起学习了Faster RCNN的损失函数以及如何进行模型训练的相关知识,如下: Faster RCNN的损失函数以及模型训练流程 ❞ 本文主要学习: One-Stage / Two-St ...

  10. 病虫害模型算法_基于深度学习的目标检测算法综述

    sigai 基于深度学习的目标检测算法综述 导言 目标检测的任务是找出图像中所有感兴趣的目标(物体),确定它们的位置和大小,是机器视觉领域的核心问题之一.由于各类物体有不同的外观,形状,姿态,加上成像 ...

最新文章

  1. centos7 nginx配置php7,centos7安装并配置nginx+php,centos7nginx
  2. 判断exception类型_C++核心准则T.44:使用函数模板推断类模板参数类型(如果可能)...
  3. 政策定价风控审批策略
  4. Fedora10 以root身份自启动
  5. 《Effective Java》 第二讲:对于所有对象都通用的方法
  6. 美国国家安全局是如何入侵你的电脑的?
  7. 游戏行业很火,游戏建模师好不好做呢?怎样的建模师公司才欢迎?
  8. bz2解压命令_Linux文件操作之文件压缩与解压缩命令详解
  9. 马斯克圣诞节晒太空飞船:明年4月测试,5年后飞火星
  10. mysql 线上修改参数_9.10、mysql进程、状态在线修改参数重要知识
  11. NetSetMan特别版 网络地址切换工具
  12. 2018最新游戏蛮牛Egret游戏引擎
  13. 那些年学过的古诗谚语名句俗语
  14. 图像金字塔——实现图像融合
  15. 超详细域名和二级域名、子域名免费配置SSL证书变成升级HTTPS(完整配置文件)
  16. 华为ME909之4G模块的开发
  17. 除了同性交友平台 GitHub,程序员们业余时间还可以去哪儿?
  18. 【leetcode.179】最大数
  19. 电脑微信关闭自动保存_微信自动保存图片怎么关闭
  20. Button 点击没有反应

热门文章

  1. 关于oracle的物理dg,单机上创建物理DG(Oracle 10g单实例)
  2. cjson 对象是json数组型结构体_CJSON中有关于在对象中放数组,数组中放对象,以及其解析...
  3. 第十一届河南省程序设计大赛----部分题解
  4. html中图片路径的几种使用方式
  5. spring boot 中文文档_已献出膝盖!GitHub上的宝藏级SpringBoot核心文档,讲得太清晰了...
  6. php date日期相关函数
  7. 如何配置filezilla服务端和客户端
  8. 关于@Autowired的使用:推荐使用构造函数进行注入
  9. OpenStack实验:创建虚拟机的问题
  10. 35 shell脚本