点击我爱计算机视觉置顶或标星,更快获取CVML新技术


今天跟大家分享一篇昨天新出的CVPR 2019论文《High-level Semantic Feature Detection:A New Perspective for Pedestrian Detection》,作者将行人检测问题转化为高级语义特征检测的问题,刷新了行人检测精度的新高度!而且作者称代码将开源。

论文作者信息:

作者分别来自国防科技大学、中科院自动化所、阿联酋起源人工智能研究院和地平线机器人公司。

算法思想

特征检测是计算机视觉中常用算法,比如我们所熟知的边缘检测、Blob检测,简单点说就是检测图像中的感兴趣部分。在传统的计算机视觉视觉中,这往往被认为是low-level的操作。

随着深度学习技术的发展,一般认为深度学习提取的特征具有高级语义特性。

作者认为行人检测中行人的中心点(x,y坐标)和尺度(宽高)是一种高级语义特征,行人检测完全可以转化为这些语义特征的检测。

如下图所示:

输入图像经过卷积网络,然后分成Center Heatmap计算和Scale Map 计算,得到的中心点坐标和宽高大小,即检测出了行人。

看起来很简单,但却是很有效!

下图是更详细的网络架构图:

该算法最主要的两部分为特征提取模块和Detection Head模块。

特征提取模块对4个Stage的特征图进行了串联,以增强特征的多尺度表达能力。

Detection Head模块,由256个3*3卷积和分支开来的两个1*1卷积组成,然后分别成为最终的Center heatmap 和Scale Map。

将现有标注好的行人检测数据集转化为中心点和尺度标注的方法是显而易见的,如下图(图中作者使用log(高度)作为行人尺度):

在Point Prediction 这一端,作者实际上尝试了中心点、顶部顶点、底部顶点等三种方式,实验结果如下图上半部分,发现使用中心点效果最好,而且是远好于另外两者。

同样在Scale Prediction这一端,作者尝试了预测高度、宽度和二者都预测。发现只预测高度的效果最好(此时设置固定宽高比0.41)。

实验结果

下面三张图是在Caltech数据集上的实验结果,该文提出的算法CSP均取得了最高的精度。

下图为在CityPersons数据集上的实验结果,CSP同样取得了最好的结果。

另外,值得一提的是,该算法不仅仅适用于行人检测!在作者的Github工程主页上放出了使用该文算法在人脸检测数据集WiderFace上的实验结果,在验证集和测试集上均取得了最高精度或者媲美最高精度的结果。

如下图所示:(请点击大图查看)

读完此文,CV君在想,人脸和行人的宽高比相对变化较小,该文提出的算法取得了很不错的结果。那么对于通用目标检测,宽高比变化比较大,该算法结果会如何呢?希望有进一步实验结果出来。

希望该文对你有帮助!

论文地址:

https://arxiv.org/abs/1904.02948v1

代码地址:

https://github.com/liuwei16/CSP

加群交流

关注行人检测技术,欢迎加入52CV-行人检测群,扫码添加CV君拉你入群,

(请务必注明:行人)

喜欢在QQ交流的童鞋,可以加52CV官方QQ群:702781905。

(不会时时在线,如果没能及时通过验证还请见谅)


长按关注我爱计算机视觉

麻烦给我一个“在看”

CVPR 2019 行人检测新思路:高级语义特征检测取得精度新突破相关推荐

  1. CVPR 2019 | 目标检测之面向更高精度的包围框回归

    CVPR 2019 | 目标检测之面向更高精度的包围框回归 背景介绍 主要内容 包围框参数化 用于包围框回归的KL loss 测试阶段的方差投票机制 实验分析 实验细节: 实验结果: 总结 参考文献 ...

  2. CVPR 2019 目标检测论文汇总

    CVPR 2019 目标检测论文汇总(0506更新中)极市平台​已认证的官方帐号84 人赞同了该文章前段时间,计算机视觉顶会CVPR 2019 公布了接收结果,极市也对此做了相关报道 ,目前官方公布了 ...

  3. 论文盘点:CVPR 2019 - 文本检测专题

    作者丨燕小花 研究方向丨计算机视觉 CRAFT 论文主要思想 本文的主要思路是先检测单个字符(character region score)及字符间的连接关系(affinity score),然后根据 ...

  4. CVPR 2019 | 文本检测算法PSENet解读与开源实现

    点击我爱计算机视觉标星,更快获取CVML新技术 作者:刘恒 编辑:CV君 PSENet文本检测算法来自论文<Shape Robust Text Detection with Progressiv ...

  5. IIAI CVPR 2019 跟踪、检测、分割论文荐读

    点击我爱计算机视觉标星,更快获取CVML新技术 本文转载自起源人工智能研究院. 撰稿:Fahad Khan,孙国磊,廖胜才,卢宪凯 导语 CVPR (Conference on Computer Vi ...

  6. CVPR 2019 | 旷视研究院提出Re-ID新方法VPM,优化局部成像下行人再识别

    全球计算机视觉三大顶级会议之一 CVPR 2019 将于当地时间 6 月 16-20 日在美国洛杉矶举办.届时,旷视研究院将带领团队远赴盛会,助力计算机视觉技术的交流与落地.在此之前,旷视每周会介绍一 ...

  7. CVPR 2019 开源论文 | 基于空间自适应归一化的图像语义合成

    作者丨武广 学校丨合肥工业大学硕士生 研究方向丨图像生成 深度学习在算力的推动下不断的发展,随着卷积层的堆叠,模型的层数是越来越深,理论上神经网络中的参数越多这样对数据的拟合和分布描述就能越细致.然而 ...

  8. CVPR 2019 | 旷视研究院提出TACNet,刷新时空动作检测技术新高度

    全球计算机视觉三大顶级会议之一 CVPR 2019 将于当地时间 6 月 16-20 日在美国洛杉矶举办.届时,旷视研究院将带领团队远赴盛会,助力计算机视觉技术的交流与落地.在此之前,旷视每周会介绍一 ...

  9. (九:2020.08.27)CVPR 2019 追踪之论文纲要(译)

    CVPR 2019 追踪之论文纲要(修正于2020.08.28) 讲在前面 论文目录 讲在前面 论坛很多博客都对论文做了总结和分类,但就医学领域而言,对这些论文的筛选信息显然需要更加精细的把控,所以自 ...

最新文章

  1. 大一c语言大作业课题大全,昆明理工大学大一C语言大作业题目.doc
  2. BJFU fudq的等式
  3. OCulus Rift 游戏开发六原则
  4. boost::hana::replace用法的测试程序
  5. 企业组织机构代码验证JavaScript版和Java版 - 修正版V20090214
  6. 18000字的SQL优化大全,收藏直接起飞!
  7. Linux内核分析 - 网络[五]:vlan协议-802.1q
  8. java连接DB2数据库
  9. 傅里叶变换 FFT 频谱泄漏?
  10. 组织行为学笔记-第一章
  11. 我们接了条预算100000000的广告!!!
  12. Vue强制刷新页面重新加载数据方法
  13. 算法到底该怎么学?算法数据结构Java编程超全干货!(ACM金牌选手分享超牛学习路径~)...
  14. 支付业务-信用卡拒付
  15. nyoj845无主之地1
  16. 【微机原理与接口技术】学习笔记4 汇编语言程序设计
  17. Flutter开发的抖音国际版
  18. sudo修改文件夹名字_linux
  19. 专业术语 EVT、DVT、PVT的含义
  20. 怎么区分开关电源的PFM与PWM模式?

热门文章

  1. vue中数组长度_如何在Vue.js中获取计算数组的长度
  2. 四舍五入算法 php,3种PHP实现四舍五入的方法
  3. java antd实现登录,AntDesign(React)学习-4 登录页面提交数据简单实现
  4. java jexl 工具类_jexl表达式解析、计算工具类.md
  5. 内存超频时序怎么调_电脑内存条专业科普,内存选购、内存品牌、内存安装、内存时序体质、内存超频频率详细讲解...
  6. 树莓派 docker homeassistant_树莓派raspberry4B入坑指南 part-4 安装docker-ce 19.03
  7. 多个pdf合并成一个pdf_十秒教你将多个PDF如何合并成一个PDF
  8. php 输出mysql查询结果_php如何输出mysql查询结果
  9. windows搭建SFTP服务器
  10. 文件路径转换为数组php,php – 如何将目录结构转换为url数组