点击我爱计算机视觉标星,更快获取CVML新技术


昨天arXiv一篇新上论文《FCHD: A fast and accurate head detector 》,来自江森自控(Johnson Controls Inc.)的软件工程师Aditya Vora分享了一种快速精准的人头检测(head detector)算法并开源了代码。
先来看看作者发布的视频效果:

看起来还是不错的!
人头检测在视频监控中非常重要,而公交车、商场或者大型场馆的拥挤人群计数则是其重要应用场景。

算法思想
作者称拥挤人群计数目前主要有两种实现路径:
1.使用回归的算法思路,直接根据图像回归出拥挤人群密度热图,它的缺点是只能得到场景整体的一个拥挤指数,不能获知人群个体的具体位置,而且这种方法对图像分辨率很敏感。(52CV君曾经分享过:尺度不变网络提升人群计数性能(附Github地址))

2.使用目标检测的方法,比如直接使用Faster RCNN检测人,检测后数目标为“人”的个数。这种方法的缺点是在人物相互遮挡的情况下往往性能较差,而人群越拥挤相互遮挡的可能性越大,导致算法使用受限。

该文作者希望设计更有针对性的精准的人头检测,实现更加精准的人群计数。
作者创新的两点,轻量级人头检测网络和anchors尺度的选择。
网络架构:

从上图可知,网络的前半部分是VGG16特征提取网络,经过一次卷积,然后分开分别使用1*1卷积进入Regression head(用于回归人头的位置信息)和Classification head(用于分类是否为人头)。

在检测网络中,anchors是很重要的概念,是一组预定义的包围框,在对象检测系统中预测尺度和位移。作者认为普通目标识别中anchors的尺度定义过大,应该根据“有效感受野”(effective receptive field)的思想,减小尺度(直观上“人头”目标比“人体”目标也要小)。

实验结果
作者在BRAINWASH数据库上做了实验,打败了三个基线算法,并取得了与最好结果算法“可比较“的性能。

提出的算法比较快,使用Quadro M1000M显卡(仅有512 CUDA核心)速度达到5fps,使用Jetson TX2(仅有256 CUDA核心)速度1.6fps。相比以往算法更加适合于嵌入式边缘计算平台。

论文地址:
https://arxiv.org/abs/1809.08766v1
代码地址:
https://github.com/aditya-vora/FCHD-Fully-Convolutional-Head-Detector

论文、代码、数据下载:
在“我爱计算机视觉”公众号对话界面回复“FCHD”,即可收到百度云下载地址。


长按关注我爱计算机视觉

【点赞与转发】就是一种鼓励!

快速精准的人头检测,代码已开源相关推荐

  1. FCHD: A fast and accurate head detector快速准确的人头检测代码预测出来的边界框位置不准确的解决方法

    算法简介 人头检测在视频监控中非常重要,而公交车.商场或者大型场馆的拥挤人群计数则是其重要应用场景. 算法思想 作者称拥挤人群计数目前主要有两种实现路径: 1.使用回归的算法思路,直接根据图像回归出拥 ...

  2. CVPR21小样本检测:蒸馏上下文助力小样本检测(代码已开源)

    计算机视觉研究院专栏 作者:Edison_G 目标检测现在的框架越来越多,我们"计算机视觉研究院"最近也分享了众多的目标检测框架!今天我们继续分享一个最新的检测框架--YOLOR. ...

  3. 国科大提出FreeAnchor,新一代通用目标检测方法,代码已开源

    点击我爱计算机视觉标星,更快获取CVML新技术 本文转载自新智元(ID:AI_era),请勿二次转载.   新智元专栏   作者:张小松 (中国科学院大学) [新智元导读]中国科学院大学联合厦门大学和 ...

  4. 树状图栏目切换_AAAI 2020 | 中山大学HCP实验室:基于树状结构策略的渐进强化学习,代码已开源...

    作者 | 吴捷 编辑 | Camel 本文对中山大学.北京航空航天大学.DMAI合作完成,被AAAI2020录用的一篇关于多模态视频理解的论文<Tree-Structured Policy ba ...

  5. Align and Prompt:SalesforceANU提出ALPRO,进行细粒度的视频文本对齐!代码已开源!...

    关注公众号,发现CV技术之美 本文分享论文『Align and Prompt: Video-and-Language Pre-training with Entity Prompts』,由 Sales ...

  6. ECCV 2020 | 空间-角度信息交互的光场图像超分辨,性能优异代码已开源

    光场相机可以记录当前场景不同视角的图像,每个视角图像的上下文信息(空间信息)与不同视角之间的互补信息(角度信息)都有助于提升图像超分辨的性能. 近日,来自国防科技大学.上海科技大学等单位的学者提出了新 ...

  7. 国科大港中文提出带视觉语言验证和迭代推理的Visual Grounding框架,性能SOTA,代码已开源!(CVPR2022)...

    关注公众号,发现CV技术之美 本文分享 CVPR 2022 的一篇论文『Improving features Visual Grounding with Visual-Linguistic Verifi ...

  8. ECCV2022 | 人大提出轻量级基于注意力的特征融合机制,在多个公开数据集上有效!代码已开源!

    ECCV2022 | 人大提出轻量级基于注意力的特征融合机制,在多个公开数据集上有效!代码已开源! [写在前面] 本文在文本到视频检索的新背景下,作者重新探讨了特征融合这一古老的课题.与以往的研究只考 ...

  9. 9 行代码提高少样本学习泛化能力,代码已开源

    点击上方"视学算法",选择加"星标"或"置顶" 重磅干货,第一时间送达 转自 | 新智元 来源 | 知乎 作者 | 杨朔 本文介绍一篇最新发 ...

最新文章

  1. QuickTime 0day ***代码发布,可能允许执行任意代码
  2. linux系统开启端口转发,linux如何使用iptables进行本地端口转发
  3. centos7 更新firefox版本
  4. Elasticsearch 节点磁盘使用率过高,导致ES集群索引无副本
  5. 952开头的电话一天响两三次,不是诈骗就是推销,请问该怎么屏蔽呢?
  6. EXCEL插入超链接——无法打开指定文件
  7. 论文翻译——Skin Lesion Synthesis with Generative Adversarial Networks
  8. 2021年第六届数维杯A题 外卖骑手的送餐危机
  9. Android 工具类
  10. 机器学习、计算机视觉神犇/大牛主页
  11. Chrome 开发者工具 Initiator 面板单击后看不到 JavaScript 源代码的解决方法
  12. java poi 操作Excel 删除行内容和直接删除行
  13. 软件测试 | 测试开发 | 测试人生 | 00后0经验应届毕业生拿下2线城市15W offer,好励志~
  14. 智能可穿戴的时尚单品,到底是不是“智商税”?
  15. 福建省谷歌卫星地图下载
  16. 单考单招计算机试卷及答案,高职单考单招计算机模拟试卷一模板.doc
  17. 代理记账公司怎样找客户?教你一个简单又有效的方法
  18. commdao.java怎么读,我发帖来求助不知道是不是很天真了
  19. 品赏第一行“Android代码“---Hello World
  20. Android App隐藏Navigation Bar

热门文章

  1. http://syy7.com/a/33.php,CVE-2020-7062
  2. vscode终端乱码
  3. 四元数姿态解算c语言例程_(21)用四元数插值来对齐IMU和图像帧
  4. gridcontrol选中多行数据进行复制_终于整理全了,数据核对的6钟方法,掌握它们数据核对你就是大神...
  5. thaiphoon burner 使用_果粉请注意,苹果iPhone 12在日常使用时有两大隐忧
  6. 虚拟主机php.ini在哪里,虚拟主机的php.ini配置文件在哪里
  7. 终端母体服务器是心识,自我意识的觉醒与重返母体的归属.doc
  8. service和controller都加了事务_「Spring声明式事务」在service内部之间调用竟然失效啦?...
  9. python在windows配置_Python在windows平台的多版本配置
  10. python找不到模块文件夹_python – __init__.py在同一目录中找不到模块