Learning Efficient Single-stage Pedestrian Detectors by Asymptotic Localization Fitting行人检测ECCV2018
Learning Efficient Single-stage Pedestrian Detectors by Asymptotic Localization Fitting 行人检测论文,ECCV2018
代码地址
论文地址
Wei Liu 1,3(国防科大) , Shengcai Liao 1,2(中国科学院大学)
原来是学长的论文呀,66666
概要:
虽然基于two-stage的检测器Faster R-CNN已经有效的提高了行人检测精确度,但是在特定应用中仍然还是比较慢。一个解决方法是用single-stage检测器,但是现阶段single-stage如SSD还是精度有欠缺的。
本文朝着SSD的速度,同时保持Faster R-CNN的精度进发。被称作ALF的渐进定位匹配网络Asymptotic Localization Fitting 被提出,它通过堆叠一系列的预测期,来直接评估SSD的anchor来一步一步的提高检测结果精度。
结果,在训练过程,靠后的预测期更倾向于优质的正样本,同时难负样本的挖掘可以增加IOU的阈值。基于此,一个有效的single-stage的行人检测网络结构ALFNet横空出世,达到了CityPersons 和 Caltech这两个行人检测最大的数据集上的最好效果,提高了行人检测的速度和精度。
Introduction
Faster RCNN慢在两阶段: proposal generation 和classification of ROIpooling features,SSD则直接回归默认anchors作为检测框,所以很快。
由于二者都有默认anchor boxes锚点,我们猜测关键在于对二阶预测过程中默认anchors boxes的处理,RPN是第一阶段,ROIs的预测是另一个阶段(但是并不是ROI-Pooling模型)
近期,Cascade R-CNN将Faster RCNN推进了一步,通过引入多步骤的ROI-pooling,在RPN之后尽心个预测。
另外,RefineNet认为ROI-pooling可以在RPN之后被卷进转换网络(convolutional transfer connection)替代。
因此,看上去SSD中的默认anchors可以被更简单的解决方式多步骤multi-stages来替代,既不用RPN也不用ROI-Pooling
SSD在行人检测中的另一个问题是,被一个单一的IOU阈值来训练, 一方面 ,低IOU阈值(如0.5)可以帮助定义出合适数量的正样本,尤其是行人数量受限的情况下。比如图1中,在Caltech中42782个图中,80% 图片没有行人,总的来说仍然是平均每张图1.4个人。低阈值会出现 ”close but not correct”接近但是不正确的结果,虚警, false positives假正实例,正如Cascade R-CNN中提到的那样。
另一方面 ,高阈值(如0.7)可以降低false positives虚警,但是训练时能匹配到的正样本少了很多,如图1b。
正负样本的定义使得高质量SSD训练很有困难,这个问题在two-stage的Faster R-CNN中得到缓和。
上述分析促使我们通过提高定位精度和增加IOU阈值,使用多步骤来训练SSD。因此,本文中简单有效的网络ALF,它可以从SSD默认anchors触发,一步一步的通过卷积来演化(进化)所有anchor boxes,推动更多的anchor boxes来接近Ground truth。
基于此,一个创新的行人检测结构被定义为ALFNet。
显著提高了检测精度,同时保持了single-stage的效率,在两个大规模行人检测数据集上进行丰富的实验和分析。总的来说本文贡献:
1.ALF模型的提出,使用多步骤的预测来渐进定位,客服了single-stage检测器的缺点
2.达到两个数据集的Stage-of-the-art ,SOTA
在行人检测的漫漫长夜中,RCNN打开了一束光明,随后各种two-stage方法,显示SCF检测器,产生proposals然后给RCNN一样的网络中去。然后是TA-CNN网络,ACF检测器作为区域推荐产生器产生proposals,之后的行人检测被各种分割任务结合在一起来优化。DeepParts使用LDCF检测器来产生proposals,然后来给CNN训练识别不同的身体部分。
https://zhuanlan.zhihu.com/p/44796359
Learning Efficient Single-stage Pedestrian Detectors by Asymptotic Localization Fitting行人检测ECCV2018相关推荐
- 目标检测--Accurate Single Stage Detector Using Recurrent Rolling Convolution
Accurate Single Stage Detector Using Recurrent Rolling Convolution CVPR 2017 商汤科技关于目标检测的文献 Code: htt ...
- 人脸检测--SSH: Single Stage Headless Face Detector
SSH: Single Stage Headless Face Detector ICCV2017 https://github.com/mahyarnajibi/SSH 本文的人脸检测算法走的是又快 ...
- Learning a Deep Single Image Contrast Enhancer from Multi-Exposure Images阅读札记
Learning a Deep Single Image Contrast Enhancer from Multi-Exposure Images阅读札记 论文发表于2018年的TIP. 1 Ab ...
- Faster Read: Learning a Deep Single Image Contrast Enhancer from Multi-Exposure Images
Single Image Contrast Enhancer IEEE Transactions on Image Processing April 2018 keywords: CNN(Convol ...
- 【3D 目标检测】3DSSD: Point-based 3D Single Stage Object Detector
一 核心思路 本篇通过观察point-based目标检测方法中,在PointNet++的上采样层(FP层)和refinement Module上面耗费了大量时间,因此作者借此提出了one-stage的 ...
- 行人检测(Pedestrian Detection)资源
行人检测(Pedestrian Detection)资源 原文链接 http://hi.baidu.com/susongzhi/item/085983081b006311eafe38e7 一.论文 C ...
- 转:行人检测(Pedestrian Detection)资源
.论文 CVPR 2012 与行人检测相关的论文 [1] Contextual Boost for Pedestrian Detection YuanyuanDing, Jing Xiao [2] ...
- 行人检测(Pedestrian Detection)资源与更新
行人检测相关的网站链接: [1].Caltech Pedestrian Detection Benchmark: http://www.vision.caltech.edu/Image_Da ...
- 行人检测--What Can Help Pedestrian Detection?
What Can Help Pedestrian Detection? CVPR2017 本文主要分析 extra features 对于 基于CNN 的行人检测有什么帮助,设计了一个行人检测网络 H ...
- Contrastive learning of Class-agnostic Activation Map for Weakly Supervised Object Localization and
paper: Contrastive learning of Class-agnostic Activation Map for Weakly Supervised Object Localizati ...
最新文章
- windows 下使用caffy_折腾下Windows下的Elasticsearch安装与使用
- SWT中调用Automation的方式
- 万维网源代码正在被发明人拍卖,有人出价1800万,还在不断上涨
- MySQL isnull()函数基本指南
- gridview 强制过长数据进行换行
- 怎么看Windows11系统是激活的 Windows11检查激活状态方法
- 42.Linux应用调试-初步制作系统调用(用户态-内核态)
- 关于OMC链接LANSWITCH
- 如何在Word中输入带圈数字1-10的黑底白字和白底黑字的数字字符?
- 速存,懒人福音!联想修复工具大全 Lenovo Quick Fix 联想智能解决工具
- Spring Cloud Bus 官方文档
- Axure8有效注册码
- 领英问题问答--有关领英各类问题整理,置顶推荐
- 一台手机=半套房?VERTU唐卡手机拍出48.3万
- 第一种可以用手机远程实时观看的网络摄像机,还带云台,报警,双向语音
- 猜数字游戏项目验收总结
- 错误集锦:在安装docker的时候,发现无法安装(没有可用软件包 docker-ce。 错误:无须任何处理)
- APP的图标测试之震惊!双11快到了,你的app在偷偷更换图标?
- 关于汽车CAN总线的介绍
- 安防监控系统 硬盘录像机如何计算硬盘容量
热门文章
- 工程电磁场matlab仿真,带电粒子在电磁场中运动的MATLAB仿真.doc
- 光线追踪(RayTracing)算法理论与实践(二)平面、材质、联合光线与物体求交
- GoogleEarth崩了!!除了重装还可以这样解决......
- MySQL-8.0.11-winx64.zip安装教程(Win10操作系统)
- u盘推荐知乎_求推荐好用的u盘?
- 游戏资源提取软件介绍
- 鸿蒙电视rom,华为鸿蒙os刷机包
- UEFI学习——在qemu上读取设备PCI信息
- 2021十大进销存软件排名
- 35万推特僵尸账号发现始末:这只是开始?