CVPR2019| ADCrowdNet: 用于人群理解的可变形卷积网络
点上方蓝字计算机视觉联盟获取更多干货
在右上方 ··· 设为星标 ★,与你不见不散
提出了一种用于人群理解的注意力可变形卷积网络ADCrowdNet,它可以解决高拥塞噪声场景的精度下降问题。ADCrowdNet包含两个连接的网络。一个名为注意力地图生成器(AMG)的注意感知网络首先检测图像中的人群区域,并计算这些区域的拥塞程度。基于检测到的人群区域和拥塞先验,一个多尺度可变形网络称为密度地图估计器(DME),然后生成高质量的密度地图。通过注意感知训练方案和多尺度可变形卷积方案,ADCrowdNet实现了更有效地捕捉人群特征和更抗各种噪声的能力。我们已经在四个流行的人群计数数据集(上海泰克、UCF CC 50、世界博览会10和UCSD)和一个额外的车辆计数数据集TRANCOS上评估了我们的方法,我们的方法在所有这些数据集上都超过了现有的最先进的方法。
介绍
人群理解因其在公共安全、拥堵避免、流量分析等方面的广泛应用而引起人们的广泛关注。目前对人群理解的研究趋势是从统计人数发展到通过密度图显示人群分布。一般来说,由于背景噪声、遮挡和人群分布的多样性导致了人群场景的复杂性,如何生成准确的人群密度图,并对高拥挤噪声场景进行精确的人群计数是一项具有挑战性的工作。
研究人员最近利用深度神经网络(DNN)来精确地生成人群密度图和精确地进行人群计数。虽然这些基于dnns的方法[32,20,24,14]在解决上述问题上取得了显著的成功,但在应用于高拥塞噪声场景时仍然存在精度下降的问题。如图1所示,与之前的最先进的方法相比,[14]方法的平均绝对误差(MAE)要低得多,但仍然受到背景噪声、遮挡和非均匀人群分布的严重影响。
本文针对人群理解问题,提出了一种能够处理高拥塞噪声场景的方法。为了实现这一目标,我们设计了一个名为ADCrowdNet的注意注入可变形卷积神经网络,该网络通过视觉注意机制和多尺度可变形卷积方案来实现。视觉注意机制经过精心设计,以减轻输入中各种噪声的影响。针对拥挤环境,提出了一种多尺度可变形卷积方案。视觉注意机制的基本原理是利用输入图像中的相关信息而不是所有可用信息来计算神经响应。这一原则关注的特定部分的输入已经成功地应用于各种深度学习模型对图像分类[10]、语义分割[19],图像去模糊[18],和视觉造成估计[5],也适合我们的问题的兴趣区域包含人群需要识别和强调从嘈杂的场面。多尺度可变形卷积方案以非均匀分布的动态采样点信息作为输入,具有复杂几何变换建模和人群分布多样化的能力。该方案很好地适应了真实场景中摄像机视角的失真和人群分布的多样性,保证了拥挤场景中人群密度图的准确性。
利用这一创新结构,提出的ADCrowdNet模型在上海科技大学A部分、B部分、UCF CC 50、WorldExpo10、UCSD数据集上的平均绝对误差(MAE)分别比目前最先进的人群统计解决方案CSRNet[14]低3.0%、18.8%、3.0%、13.9%和5.1%。除了人群统计,ADCrowdNet也适用于其他统计任务。我们在一个名为TRANCOS[9]的流行车辆计数数据集上对ADCrowdNet进行了评估,ADCrowdNet的MAE比CSRNet低32.8%。
ADCrowdNet
实验和结果
论文地址:
https://arxiv.org/pdf/1811.11968.pdf
加群交流
欢迎加入CV联盟群了解CV和ML等领域前沿资讯
扫描添加CV联盟微信拉你进群,备注:CV联盟
热文荐读
最全中科大计算机学院课程资源(含答案)
必备收藏!超全 TensorFlow 代码集,随查随看!
【收藏】CMU、斯坦福等知名AI实验室、团队AI成果大盘点
近十年以来机器学习中最优秀的想法~一文带你领略GANs核心
卡内基·梅隆大学新提出AdaScale:自适应缩放实现视频对象实时检测算法
计算机视觉奠基人Alan L. Yuille :深度学习在计算机视觉中作用有限,需要找到新的突破口!
CVPR2019| ADCrowdNet: 用于人群理解的可变形卷积网络相关推荐
- (ICCV-2017)可变形卷积网络
可变形卷积网络 paper题目:Deformable Convolutional Networks paper是Microsoft Research Asia发表在ICCV 2017的工作 paper ...
- 可变形卷积网络--Deformable Convolutional Networks
https://arxiv.org/abs/1703.06211 Microsoft Research Asia Code coming soon 本文可以看做是对 Spatial Transform ...
- sar极化想干矩阵_用于PolSAR图像分类的极化卷积网络
来源:TGRS 2019 原文:https://arxiv.org/pdf/1807.02975.pdf code:https://github.com/liuxuvip/Polarimetric-S ...
- 港中文旷视提出PanopticFCN:用于全景分割的全卷积网络
表现SOTA!性能优于Panoptic-DeepLab.AdaptIS和PCV等网络,代码现已开源! 注1:文末附[计算机视觉细分垂直方向]交流群(含检测.分割.跟踪.医疗.GAN.Transform ...
- 可变形卷积学习(RepPoints)
近来在学习anchor-free网络,看到了可变形卷积(Deformable Convolutional Networks(DCN))的内容,大致总结一下,便于后面回顾. 可变形卷积可从以下三篇论文去 ...
- 可变形卷积(Deformable Convolution)
可变形卷积 前言: 一.可变形卷积 1.原文摘要(Abstract) 2.可变形卷积 前言: 之前分了两次将深度学习中常用的各种卷积操作进行了汇总介绍,具体包括标准2D卷积.1×1卷积.转置卷积.膨胀 ...
- 分组卷积/转置卷积/空洞卷积/反卷积/可变形卷积/深度可分离卷积/DW卷积/Ghost卷积/
文章目录 1. 常规卷积 2. 分组卷积 3. 转置卷积 4. 空洞卷积 5. 可变形卷积 6. 深度可分离卷积(Separable Convolution) 6.1 Depthwise Convol ...
- 全卷积网络用于手语识别
Fully Convolutional Networks for Continuous Sign Language Recognition 年份 识别类型 输入数据类型 手动特征 非手动特征 Full ...
- 12、理解与可视化卷积神经网络
目录 12.1 可视化卷积神经网络学习到的东西 12.1.1可视化激活和第一层权重 12.1.2 找到对神经元有最大激活的图像 12.1.3 用 t-SNE 嵌入代码 12.1.4 遮挡部分图像 12 ...
最新文章
- 可怕!Facebook竟能识别出性工作者!你怎么看?
- 基于sharepoint 2003的内容管理1.0
- MFC中CString.format用法
- 字符串野指针 百练2681
- Prism区域异常问题分析(导航失效?)
- 数据分析工具篇——数据读写
- 一般python项目的结构
- QT5(一):HelloWord
- 浅谈Session与Cookie的区别与联系
- MacOS怎么使用分区加密功能?MacOS硬盘分区加密功能使用方法
- *使用phpspider -- PHP蜘蛛爬虫框架来爬取数据
- The Devil is in the Details: Self-Supervised Attention for Vehicle Re-Identification(翻译)
- centos6添加系统服务
- win7命名计算机无法下一步,win7还原系统不能点下一步怎么办(无响应)
- 计算机的玩法教程,第五人格电脑版怎么玩 电脑版玩法教程
- Power Apps平台利用CDS(Common Data Service)制作问卷调查
- 【CAD】多段线的合并与闭合的操作与测试
- FleaPHP 开发指南
- 中国移动光猫桥接模式
- 揭秘:HR的嘴骗人的鬼!这三个陷阱要小心!
热门文章
- java c 转换_Java怎么转换c语言?
- 外卖和快递行业数据_外卖和快递骑手管理“上轨道”
- vs移植的.exe再编译无法更新_CODE|编译带PDAL的cloudcompare(补充)
- python如何做接口测试_python实现接口测试
- python list 实现原理,Python 列表(List)的底层实现原理分析
- MariaDB之SQL语句基础
- redis 系列17 持久化 AOF
- 基于SVM的python简单实现验证码识别
- HTML5中的Web Notification桌面通知(右下角提示)
- Effective STL(第7条)