点击上方“CVer”,选择"星标"和“置顶”

重磅干货,第一时间送达

前戏

最近目标检测方向,出了很多很棒的paper,CVer也立即跟进报道(点击可访问):

  • 中科院牛津华为诺亚提出:CenterNet,One-stage目标检测最强算法!可达47mAP,已开源!

  • 谷歌大脑提出:基于NAS的目标检测模型NAS-FPN,超越Mask R-CNN

  • 最新的Anchor-Free目标检测模型FCOS,现已开源!

本文要介绍一篇实时性好,准确率又高的论文:CornerNet-Lite。该论文是由 普林斯顿大学的几位学者提出。截止2019年4月20日,据Amusi所了解,CornerNet-Lite 应该是目标检测(Object Detection)中 FPS和 mAP trade-off 最佳算法。

注:标题注明"吊打YOLOv3",这个不是标题党。因为CornerNet-Lite 在 FPS和mAP上都超过了YOLOv3,具体详见下文介绍。

简介

《CornerNet-Lite: Efficient Keypoint Based Object Detection》

arXivhttps://arxiv.org/abs/1904.08900

github: https://github.com/princeton-vl/CornerNet-Lite

作者团队:普林斯顿大学

注:2019年04月19日刚出炉的paper

Abstract:基于关键点的方法是目标检测中相对较新的范例,消除了对 anchor boxes 的需求并提供了简化的检测框架。基于Keypoint的CornerNet在单级(single-stage)检测器中实现了最先进的精度。然而,这种准确性来自高处理代价。在这项工作中,我们解决了基于关键点的高效目标检测问题,并引入了 CornerNet-Lite。CornerNet-Lite是CornerNet的两种有效变体的组合:CornerNet-Saccade,它使用注意机制消除了对图像的所有像素进行彻底处理的需要,以及引入新的紧凑骨干架构的 CornerNet-Squeeze。这两种变体共同解决了有效目标检测中的两个关键用例:在不牺牲精度的情况下提高效率,以及提高实时效率的准确性。CornerNet-Saccade适用于离线处理,将CornerNet的效率提高6.0倍,将COCO的效率提高1.0%。CornerNet-Squeeze适用于实时检测,提高了流行的实时检测器YOLOv3的效率和准确性(CornerNet-Squeeze为34ms时34.4mAP,而COCO上为YOLOv3时为39ms,33mAP)。这些贡献首次共同揭示了基于关键点的检测对于需要处理效率的应用的潜力。

背景

CornetNet 在 ECCV 2018 (oral)上横空出世,引领一波基于关键点的目标检测狂潮(最近anchor-free盛行),但这类算法(很多one-stage)也有缺点。虽然mAP有很大提升,但速度上都远不能达到实时(有些论文就避而不谈FPS了)。这其实可以看成学术阶段的成果,但距离落地应用还有一点距离。

而 本文CornetNet-Lite 是对CornetNet进行优化,提出了两种算法:

  • CornerNet-Saccade

  • CornerNet-Squeeze

在 Amusi 看来:

CornerNet-Saccade 是追求高准确率(mAP)的同时,尽可能提高速度(FPS),即准确率优先,其对标于CornerNet等算法。创新点:引入Saccade思想

CornerNet-Squeeze 是追求高实时性(FPS)的同时,尽可能提高准确率(mAP),即速度优先,其对标于YOLOv3等算法。创新点:引入SqueezeNet优化思想

正文

1 CornerNet-Saccade

什么是 Saccades?

人类视觉中的 Saccades(扫视运动)是指用于固定不同图像区域的一系列快速眼动。在目标检测算法中,我们广义地使用该术语来表示在推理期间选择性地裁剪(crop)和处理图像区域(顺序地或并行地,像素或特征)。

CornerNet-Saccade中的 saccades 是 single type and multi-object。CornerNet-Saccade 检测图像中可能的目标位置周围的小区域内的目标。它使用缩小后的完整图像来预测注意力图和粗边界框;两者都提出可能的对象位置,然后,CornerNet-Saccade通过检查以高分辨率为中心的区域来检测目标。它还可以通过控制每个图像处理的最大目标位置数来提高效率。具体流程如下图所示。

CornerNet-Saccade 设计了一种新的backbone:Hourglass-54(含3个hourglass模块,深度为54)。原CornerNet中使用的是 Hourglass-104(含2个hourglass模块,深度为54)。

注:crop在CornerNet-Saccade中作用非常大

2 CornerNet-Squeeze

与专注于subset of the pixels以减少处理量的CornerNet-Saccade相比,而CornerNet-Squeeze 探索了一种减少每像素处理量的替代方法。在CornerNet中,大部分计算资源都花在了Hourglass-104上。Hourglass-104 由残差块构成,其由两个3×3卷积层和跳连接(skip connection)组成。尽管Hourglass-104实现了很强的性能,但在参数数量和推理时间方面却很耗时。为了降低Hourglass-104的复杂性,本文将来自SqueezeNet和MobileNets 的想法融入到 lightweight hourglass 架构中。

主要操作是:

  • 受SqueezeNet启发,CornerNet-Squeeze将 residual block 替换为SqueezeNet中的 Fire module

  • 受MobileNet启发,CornerNet-Squeeze将第二层的3x3标准卷积替换为 3x3 深度可分离卷积(depth-wise separable convolution)

具体如下表所示:

3 实验结果

开源代码是基于PyToch1.0.0,在COCO数据集上进行测试。测试硬件环境为:1080ti GPU + Intel Core i7-7700k CPU。

One-stage 算法性能比较

CornerNet-Saccade 算法性能比较

可见 Hourglass-54要强于Hourglass-104,另外gt attention对涨点帮助很大

CornerNet-Squeeze 算法性能比较

见证奇迹的时候来了!CornerNet-Squeeze 吊打YOLOv3,因为即使是C语言版本的YOLOv3,都已被全方位(mAP+FPS)超过。

注:日常期待一下YOLOv4,毕竟YOLOv3已经是去年3月的"老人"了。

代码已开源,快快下载尝试一波:

https://github.com/princeton-vl/CornerNet-Lite

推荐阅读

目标检测:Anchor-Free时代

物体检测的轮回:Anchor-based 与 Anchor-free

深度学习的目标检测算法是如何解决尺度问题的?

最新的Anchor-Free目标检测模型FCOS,现已开源!

CVer目标检测交流群

扫码添加CVer助手,可申请加入CVer-目标检测交流群。一定要备注:目标检测+地点+学校/公司+昵称(如目标检测+上海+上交+卡卡)

▲长按加群

这么硬的论文,麻烦给我一个在看

▲长按关注我们

麻烦给我一个在看

3目标检测的准确率_吊打YOLOv3!普林斯顿大学提出:CornerNetLite,基于关键点的实时且精度高的目标检测算法,已开源!...相关推荐

  1. 仅需12层网络,在ImageNet上准确率达到80.7%!普林斯顿大学最新提出ParNet!

    [导读]自从2012年深度学习兴起以来,深度,宽度,多尺度,分辨率,group数目,注意力模块等等都是影响卷积神经网络性能的关键因素.因此,后面大多网络比如:VGGNet.HighwayNet.Res ...

  2. 高铁检测试验软件,京沪高铁试验检测项目

    <京沪高铁试验检测项目>由会员分享,可在线阅读,更多相关<京沪高铁试验检测项目(10页珍藏版)>请在人人文库网上搜索. 1.京沪高铁试验检测项目1混凝土原材料每盘称量偏差应符合 ...

  3. 直线检测——对比M-LSD直线检测(基于深度学习)与霍夫曼直线检测

    前言 1.直线检测在好多实现应用中能用到到,比如文档扫描,辅助驾驶中的车道线检测,传统的算法用的最多应该属于霍夫曼直线检测,但传统算法都有一个痛苦的调参过程和只能对优化过的使用场景有较好的结果,换个场 ...

  4. matlab基于ssd的角点匹配_基于关键点的目标检测

    0 1 前言:基于锚点的目标检测方法 在基于关键点(key points)的目标检测方法出现之前,主流目标检测方法一般先设置一些预先定义好的 锚点 (anchor boxes). 作为预测物体框的参考 ...

  5. 刷新COCO目标检测纪录!谷歌只靠AI扩增数据,就把一个模型变成SOTA,已开源

    栗子 发自 凹非寺  量子位 报道 | 公众号 QbitAI 谷歌大脑Quoc Le团队,又训练出了一只地表最强的模型. 这是一个目标检测模型,从前并不是最强大. 但自从团队用机器学习解锁了特别的数据 ...

  6. 目标检测的尽头是语言建模?Hinton团队提出Pix2Seq,性能媲美DETR

    ©作者 | 机器之心编辑部 来源 | 机器之心 目标检测的「尽头」是语言建模?近日,Hinton 团队提出了全新目标检测通用框架 Pix2Seq,将目标检测视作基于像素的语言建模任务,实现了媲美 Fa ...

  7. 【目标检测_keypoint based 方法系列】基于关键点的目标检测

    文章目录 一.CornerNet 二.ExtremeNet 三.CenterNet 3.1 关键步骤: 3.2 关键点检测网络: 3.3 目标大小的回归 3.4 从点到b-box: 3.5 Cente ...

  8. kettle spoon判断增量更新_【论文推荐】张斌等:基于改进 SOINN 算法的恶意软件增量检测方法...

    基于改进SOINN算法的恶意软件增量检测方法 张斌1,2, 李立勋1,2, 董书琴1,2 1 信息工程大学,河南 郑州 450001 2 河南省信息安全重点实验室,河南 郑州 450001 摘要:针对 ...

  9. 阿里达摩院开源DAMO-YOLO:兼顾速度与精度的新目标检测框架

    作者丨陈威华 阿里达摩院智能计算实验室 编辑丨极市平台 1.简介 DAMO-YOLO是一个兼顾速度与精度的目标检测框架,其效果超越了目前的一众YOLO系列方法,在实现SOTA的同时,保持了很高的推理速 ...

最新文章

  1. 各种边缘检测算法效果对比-差分运算法、Sobel、Scharr、Laplace(拉普拉斯)、Roberts、Canny
  2. poj1195 Mobile phones 二维线段树入门
  3. linux磁盘和文件系统管理
  4. 修改图层的范围_PS教程连载第47课:PS图层操作案例星球
  5. 阿里云服务器——centos7下源码安装tomcat9
  6. word正在等候其他应用程序完成OLE操作
  7. 多迪技术总监告诉你:学习Python语言有哪些就业方向?
  8. 关于Jbulder2006的问题
  9. Oracle数据库出现问题时,这十个脚本帮你快速定位原因
  10. 备份 dup linux,13个开源备份解决方案盘点
  11. MATLAB偏微分方程数值解视频课程
  12. c语言 愚人节题目,愚人节整人题目大全
  13. 如何屏蔽谷歌浏览器的账号密码自动填充和账号密码选择
  14. 内网渗透思路10之SPN拿下域控
  15. 生物医学数据统计分析-相关性分析
  16. 号外!2021考研政治肖1000大幅修订?你的肖1000Anki牌组笔记已出炉!
  17. 为什么lol计算机内存不足怎么办,win7玩LOL英雄联盟提示“内存不足”怎么处理?(图文)...
  18. 机房收费系统(VB.NET)——超详细的报表制作过程
  19. krap病毒家族解密方式及ao变种分析
  20. STEP7 V5.7安装包下载链接及安装教程

热门文章

  1. Go内置库模块 flag
  2. jquery 里面对数组去重操作-unique
  3. jQuery 遍历 - slice() 方法
  4. java iterator map_Java循环遍历输出map方法
  5. 微服务中远程调用Dubbo与Feign对比
  6. spring boot在运行测试类Error creating bean with name ‘serverEndpointExporter‘ defined...问题解决方案
  7. python爬虫---requests库的用法
  8. imdb数据集_朴素贝叶斯分类imdb(代码分享)
  9. 自定义JAVA注解_深入理解Java:自定义java注解
  10. uniapp连接php,thinkphp5 对接手机uni-app的unipush推送(个推)