(欢迎关注“我爱计算机视觉”公众号,一个有价值有深度的公众号~)

人群计数是通过计算机视觉计算人群数量,在公共安全和城市规划中有非常重要的应用。今天分享的文章通过改进网络对该任务的尺度不变性,显著提高了人群计数算法性能。

文章来自几天前arXiv新上论文《Stacked Pooling: Improving Crowd Counting by Boosting Scale Invariance》,作者信息:

在计算机视觉中尺度不变是经常被讨论的话题,与其相关最著名的算法就是大名鼎鼎的SIFT(尺度不变特征变换)了。该论文作者通过观察发现,在人群计数这一领域,图像不同区域通过resize到相同大小,在尺度上具有高度的视觉相似性。请看下面这幅图:

来自同一幅图像和不同的图像经过resize,子图内的人物大小、人群密度、层叠关系视觉上很相似。
由于神经网络中池化层直接关系到网络的尺度变化,所以本文作者希望改进池化层,提高人群计数的算法性能。

作者在vanilla pooling基础上发明了两种池化层变种,multi-kernel pooling 和 stacked pooling。
multi-kernel pooling图示:


stacked pooling图示:

为验证所提的池化层的有效性,作者们使用VGG-13网络的各种变形来进行人群计数。网络的变化包括卷积核大小,网络宽度、深度等,如下图所示:

作者在ShanghaiTech-A数据集上验证multi-kernel pooling在高密度组比vanilla pooling要好,而在整个ShanghaiTech-B数据集上multi-kernel pooling都是更好的。

使用stacked pooling方法的各种网络变种都在ShanghaiTech数据集上比vanilla pooling好,且具有明显的性能提升。

在WorldExpo’10数据集上大部分场景也取得了更好的效果。

代码主页:
https://github.com/siyuhuang/crowdcount-stackpool

更多精彩推荐:

NVIDIA ECCV18论文:超像素采样网络助力语义分割与光流估计(代码将开源)

OpenCV深度学习文本检测示例程序(EAST text detector)

MaskFusion:惊艳的结合实例感知、语义分割、动态追踪的SLAM系统

(欢迎关注“我爱计算机视觉”公众号,一个有价值有深度的公众号~)

尺度不变网络提升人群计数性能(附Github地址)相关推荐

  1. 【我的安卓进阶之旅】Opengl Es(5)三维图形绘制圆锥、圆柱和球体(附Github地址)

    之前的博客中,我们绘制了三角形.正方形.圆形.立方体,今天我们将绘制圆锥.圆柱和球体.能够绘制这些基本的常规几何形体后,其他的常见几何形体的绘制对于我们来说就基本没问题了. 绘制圆锥 由之前的博客,我 ...

  2. 今日 Paper | 虚拟试穿网络;人群计数基准;联邦元学习;目标检测等

    2020-01-15 05:41:40 为了帮助各位学术青年更好地学习前沿研究成果和技术,AI科技评论联合Paper 研习社(paper.yanxishe.com),推出[今日 Paper]栏目, 每 ...

  3. 高精度人脸表情识别(附GitHub地址)

    编者按:本文原作者吴捷,目前于中山大学就读研究生.研究领域为计算机视觉与自然语言处理.本文原载于知乎,经作者授权发布.欢迎去GitHub给大佬加星. 先放出GitHub地址: https://gith ...

  4. Top10机器学习开源项目发布,历时一个月评出 | 附GitHub地址

    原作:Mybridge 问耕 补充整理 量子位 出品 | 公众号 QbitAI 从将近250个机器学习开源项目中,综合各种条件进行打分排序,最终Mybridge团队评选出十大最新.最棒的机器学习开源项 ...

  5. ECCV18 | 如何正确使用样本扩充改进目标检测性能(附Github地址)

    (欢迎关注"我爱计算机视觉"公众号,一个有价值有深度的公众号~) 众所周知,在计算机视觉识别任务中,对训练样本进行增广是非常重要的,可以减少过拟合.改进模型泛化性能. 在大多数视觉 ...

  6. BMVC18|无监督深度关联学习大幅提高行人重识别性能(附Github地址)

    (欢迎关注"我爱计算机视觉"公众号,一个有价值有深度的公众号~) 本文选自BMVC2018的论文<Deep Association Learning for Unsuperv ...

  7. 五个好用的网络协议分析工具(附下载地址)

    Network Packet Analyzer,是一种网络分析程序,可以帮助网络管理员捕获.交互式浏览网络中传输的数据包和分析数据包信息等.这里给出了5个最好的网络数据包分析工具,具体如下: 1. W ...

  8. 六种常用的网络流量特征提取工具,附下载地址!

    六种常用的网络流量特征提取工具.在互联网用户行为分析和异常行为检测的相关研究中,协议识别和特征提取是网络流量特征分析的重要技术手段.下面,本文为大家介绍几款常用的网络流量特征提取的工具. 1.Wire ...

  9. ECCV18|这篇论文开源的车牌识别系统打败了目前最先进的商业软件(附Github地址)...

    (欢迎关注"我爱计算机视觉"公众号,一个有价值有深度的公众号~) 来自巴西阿雷格里港大学的学者发表于ECCV2018的论文<License Plate Detection a ...

最新文章

  1. 轻松抓鸡蛋、剪纸、夹芯片,这只“机械爪”堪比人手!
  2. 清华首个AI虚拟学生“华智冰”首次露正脸唱歌,颜值与智慧并存
  3. String[] arrayIP= null;的典型错误
  4. 剑指offer:数字在排序数组中出现的次数
  5. C#中的get和post请求(工具类)
  6. distanceTransform函数
  7. 车提示检测轮胎气压_无钥匙启动的车启动后,车主带着钥匙离开车,能不能把车开走?...
  8. 了解计算机指令和汇编指令
  9. linux 杀死t状态进程,Linux下如何查杀stopped进程
  10. nginx 电子书_13本免费的电子书,拿走,不谢
  11. vue lang_推荐一个基于Vue 的 H5 快速开发模板
  12. Linux环境Eclipse + Tomcat + MySQL 构造J2EE方法开发环境
  13. Oracle9i数据库DataGuard实施及维护手册3
  14. MockServer 服务框架
  15. 算法注册机编写扫盲之续篇--第一课
  16. PAT a1138
  17. shell编程快速入门(一)
  18. python123作业怎么提交_使用python提交作业
  19. 工厂模式--简单工厂模式--抽象工厂模式
  20. 酷派大神F2使用QPST进行nv备份恢复,解决无信号问题

热门文章

  1. 【环境搭建001】ubuntu 和 win7 在vm 下的文件夹共享实践
  2. Java如何封装JDK_java7JDK的常用封装类型
  3. 移动端点击拉起输入_耐用的筛分式移动破碎站
  4. mysql c接口内存泄漏_MySQL C ++连接器内存泄漏
  5. 【script】python自定义时间格式的几种情况
  6. 王者荣耀专区系统服务器繁忙,王者荣耀跨系统转区开放!详细问答汇总,解决全部转区疑惑!...
  7. Linux系统NFS什么意思,挂载NFS到底是什么概念
  8. linux编译静态库的头文件,条件编译,头文件,静态库,共享库与多文件编程
  9. MySQL性能医生:Orzdba工具安装和使用
  10. IDEA导入项目笔记二