CVPR2019| ADCrowdNet: 用于人群理解的可变形卷积网络

点上方蓝字计算机视觉联盟获取更多干货

在右上方 ··· 设为星标 ★，与你不见不散

提出了一种用于人群理解的注意力可变形卷积网络ADCrowdNet，它可以解决高拥塞噪声场景的精度下降问题。ADCrowdNet包含两个连接的网络。一个名为注意力地图生成器(AMG)的注意感知网络首先检测图像中的人群区域，并计算这些区域的拥塞程度。基于检测到的人群区域和拥塞先验，一个多尺度可变形网络称为密度地图估计器(DME)，然后生成高质量的密度地图。通过注意感知训练方案和多尺度可变形卷积方案，ADCrowdNet实现了更有效地捕捉人群特征和更抗各种噪声的能力。我们已经在四个流行的人群计数数据集(上海泰克、UCF CC 50、世界博览会10和UCSD)和一个额外的车辆计数数据集TRANCOS上评估了我们的方法，我们的方法在所有这些数据集上都超过了现有的最先进的方法。

介绍

人群理解因其在公共安全、拥堵避免、流量分析等方面的广泛应用而引起人们的广泛关注。目前对人群理解的研究趋势是从统计人数发展到通过密度图显示人群分布。一般来说，由于背景噪声、遮挡和人群分布的多样性导致了人群场景的复杂性，如何生成准确的人群密度图，并对高拥挤噪声场景进行精确的人群计数是一项具有挑战性的工作。

研究人员最近利用深度神经网络(DNN)来精确地生成人群密度图和精确地进行人群计数。虽然这些基于dnns的方法[32,20,24,14]在解决上述问题上取得了显著的成功，但在应用于高拥塞噪声场景时仍然存在精度下降的问题。如图1所示，与之前的最先进的方法相比，[14]方法的平均绝对误差(MAE)要低得多，但仍然受到背景噪声、遮挡和非均匀人群分布的严重影响。

本文针对人群理解问题，提出了一种能够处理高拥塞噪声场景的方法。为了实现这一目标，我们设计了一个名为ADCrowdNet的注意注入可变形卷积神经网络，该网络通过视觉注意机制和多尺度可变形卷积方案来实现。视觉注意机制经过精心设计，以减轻输入中各种噪声的影响。针对拥挤环境，提出了一种多尺度可变形卷积方案。视觉注意机制的基本原理是利用输入图像中的相关信息而不是所有可用信息来计算神经响应。这一原则关注的特定部分的输入已经成功地应用于各种深度学习模型对图像分类[10]、语义分割[19],图像去模糊[18],和视觉造成估计[5],也适合我们的问题的兴趣区域包含人群需要识别和强调从嘈杂的场面。多尺度可变形卷积方案以非均匀分布的动态采样点信息作为输入，具有复杂几何变换建模和人群分布多样化的能力。该方案很好地适应了真实场景中摄像机视角的失真和人群分布的多样性，保证了拥挤场景中人群密度图的准确性。

利用这一创新结构，提出的ADCrowdNet模型在上海科技大学A部分、B部分、UCF CC 50、WorldExpo10、UCSD数据集上的平均绝对误差(MAE)分别比目前最先进的人群统计解决方案CSRNet[14]低3.0%、18.8%、3.0%、13.9%和5.1%。除了人群统计，ADCrowdNet也适用于其他统计任务。我们在一个名为TRANCOS[9]的流行车辆计数数据集上对ADCrowdNet进行了评估，ADCrowdNet的MAE比CSRNet低32.8%。

ADCrowdNet

实验和结果

论文地址：

https://arxiv.org/pdf/1811.11968.pdf

加群交流

欢迎加入CV联盟群了解CV和ML等领域前沿资讯

扫描添加CV联盟微信拉你进群，备注：CV联盟

热文荐读

最全中科大计算机学院课程资源（含答案）

必备收藏！超全 TensorFlow 代码集，随查随看！

【收藏】CMU、斯坦福等知名AI实验室、团队AI成果大盘点

近十年以来机器学习中最优秀的想法~一文带你领略GANs核心

卡内基·梅隆大学新提出AdaScale：自适应缩放实现视频对象实时检测算法

计算机视觉奠基人Alan L. Yuille ：深度学习在计算机视觉中作用有限，需要找到新的突破口！

CVPR2019| ADCrowdNet: 用于人群理解的可变形卷积网络相关推荐

(ICCV-2017)可变形卷积网络
可变形卷积网络 paper题目:Deformable Convolutional Networks paper是Microsoft Research Asia发表在ICCV 2017的工作 paper ...
可变形卷积网络--Deformable Convolutional Networks
https://arxiv.org/abs/1703.06211 Microsoft Research Asia Code coming soon 本文可以看做是对 Spatial Transform ...
sar极化想干矩阵_用于PolSAR图像分类的极化卷积网络
来源:TGRS 2019 原文:https://arxiv.org/pdf/1807.02975.pdf code:https://github.com/liuxuvip/Polarimetric-S ...
港中文旷视提出PanopticFCN：用于全景分割的全卷积网络
表现SOTA!性能优于Panoptic-DeepLab.AdaptIS和PCV等网络,代码现已开源! 注1:文末附[计算机视觉细分垂直方向]交流群(含检测.分割.跟踪.医疗.GAN.Transform ...
可变形卷积学习（RepPoints）
近来在学习anchor-free网络,看到了可变形卷积(Deformable Convolutional Networks(DCN))的内容,大致总结一下,便于后面回顾. 可变形卷积可从以下三篇论文去 ...
可变形卷积（Deformable Convolution）
可变形卷积前言: 一.可变形卷积 1.原文摘要(Abstract) 2.可变形卷积前言: 之前分了两次将深度学习中常用的各种卷积操作进行了汇总介绍,具体包括标准2D卷积.1×1卷积.转置卷积.膨胀 ...
分组卷积/转置卷积/空洞卷积/反卷积/可变形卷积/深度可分离卷积/DW卷积/Ghost卷积/
文章目录 1. 常规卷积 2. 分组卷积 3. 转置卷积 4. 空洞卷积 5. 可变形卷积 6. 深度可分离卷积(Separable Convolution) 6.1 Depthwise Convol ...
全卷积网络用于手语识别
Fully Convolutional Networks for Continuous Sign Language Recognition 年份识别类型输入数据类型手动特征非手动特征 Full ...
12、理解与可视化卷积神经网络
目录 12.1 可视化卷积神经网络学习到的东西 12.1.1可视化激活和第一层权重 12.1.2 找到对神经元有最大激活的图像 12.1.3 用 t-SNE 嵌入代码 12.1.4 遮挡部分图像 12 ...

CVPR2019| ADCrowdNet: 用于人群理解的可变形卷积网络

CVPR2019| ADCrowdNet: 用于人群理解的可变形卷积网络相关推荐

最新文章

热门文章