CSRNet: Dilated Convolutional Neural Networks for Understanding the Highly Congested Scenes
CVPR2018

针对复杂场景的拥挤场景理解我们提出了一个 CSRNet 网络,该网络主要包括两个部分,前端使用一个 卷积网络用于 2D 特征提取,后端用一个 dilated CNN。 该网络在几个常用的公开人群密度估计数据库上取得了不错的效果。

1 Introduction
拥挤场景解析的发展从简单的人群数值估计到 人群密度图估计,人群密度图可以提供额外的信息,因为同样数量的人可以分布在不同的位置,如下图所示

生成准确的人群分布图挑战性比较大,其中一个主要的困难就是离散化的问题,人在图像中不是只占用一个像素,密度图需要保持局部邻域的连续性。其他的困难包括场景的多样性,相机角度的多样性。

以前基于CNN网络的人群密度估计主要采用了 multi-scale architectures,虽然取得了不错的性能,但是存在两个问题:当网络变深的时候, the large amount of training time and the non-effective branch structure ,这里我们设计了一个实验验证了 multi-column CNN (MCNN) 表现的效果没有 比 没采用 multi-column 的要好。
这里我们设计了一个 a deeper, regular network with the similar amount of parameters

设计 multi-column CNN (MCNN) 的本意是希望可以学习不同尺寸感受野的特征,但是下图显示三个column 学习到的特征相似,没有达到设计之初的目的。

人群密度估计从方法上来说可以分为三大类:detection-based methods, regression-based methods, and density estimation-based methods

其中基于CNN的密度图估计多数采用了 multi-column based architecture (MCNN) 的架构,我们观察到这种结构存在几个问题:
1)Multi-column CNNs 比较难训练
2)Multi-column CNNs 引入了冗余的网络结构,如表1 所示
3) 需要 density level classifier ,这样计算量比较大
4) 这些网络用了很大一部分参数用于 density level classification,用于密度图估计的参数占小部分

3 Proposed Solution
这里我们不采用多分支网络结构
The fundamental idea of the proposed design is to deploy a deeper CNN for capturing high-level features with larger receptive fields and generating high-quality density maps without brutally expanding network complexity.

3.1. CSRNet architecture
网络的前端我们采用 VGG-16 卷积层部分,在后端我们采用 dilated convolutional layers

3.1.1 Dilated convolution

3.1.2 Network Configuration

3.2. Training method
3.2.1 Ground truth generation

不同数据库真值密度图的生成

3.2.2 Data augmentation
这里我们做了一些数据增强来增加训练样本的数量

3.2.3 Training details
损失函数如下:

4 Experiments
4.1. Evaluation metrics

人群密度估计--CSRNet: Dilated Convolutional Neural Networks for Understanding the Highly Congested Scenes相关推荐

  1. 论文学习笔记:CSRNet: Dilated Convolutional Neural Networks for Understanding the Highly Congested Scenes

    CSRNet是2018年提出来的人群计数模型,其论文发表于CVPR会议. 论文链接:CSRNet Abstract 摘要 我们提出了一个拥挤场景识别网络CSRNet,它提供了一种数据驱动的深度学习方法 ...

  2. 论文解读 CSRNet: Dilated Convolutional Neural Networks for Understanding the Highly Congested Scenes

    abstract 1.提出CSRNet是为了处理非常密集的场景,提供准确的计数和密度图 2.提出的CSRNet主要两部分组成:提取二维特征的CNN做前端,膨胀的CNN做后端,膨胀的卷积核是为了获得更大 ...

  3. CSRNet: Dilated Convolutional Neural Networks for Understanding the Highly Congested Scenes

    本文首先针对MCNN,提出了其两个缺点:大量的训练时间和无效的分支架构. MCNN由于使用了多列网络,参数比较多,需要训练时间长容易理解.可是作者为什么说MCNN的多列是"无效的分支&quo ...

  4. 2018_Csrnet: Dilated convolutional neural networks for understanding the highly congested scenes

    Csrnet: Dilated convolutional neural networks for understanding the highly congested scenes 说明 概括 一. ...

  5. CSRNet: Dilated Convolutional Neural Networks for Understanding the Highly Congested Scenes2018—论文笔记

    本论文来自CVPR2018, 读于20190409. Abstract 我们提出的Congested Scene Recognition(CSRNet)包含了两个部分,一个是获得二维特征的前端,一个是 ...

  6. 人群计数:CSRNet-Dilated Convolutional Neural Networks for Understanding the Highly Congested Scenes

    (鉴于有朋友提到模型去哪里下载的问题,这里多加一句) CSRNet 官方GitHub地址:https://github.com/leeyeehoo/CSRNet-pytorch 这里面包括代码和训练好 ...

  7. CRSNet: Dilated Convolutional Neural Networks for Underatanding the Highly Congested Scenes

    CRSNet: Dilated Convolutional Neural Networks for Underatanding the Highly Congested Scenes 针对复杂场景拥挤 ...

  8. DEEPCON: protein contact prediction using dilated convolutional neural networks with dropout

    今天真的要开始正式进入科研状态了,之前一直都进入失败,咳!那就先来看一篇相关领域的论文吧 ---------------------------------------------- 题目:DEEPC ...

  9. 快速人群密度估计--Multi-scale Convolutional Neural Networks for Crowd Counting

    Multi-scale Convolutional Neural Networks for Crowd Counting https://arxiv.org/abs/1702.02359 对于人群密度 ...

最新文章

  1. 献给新一代AI后浪们----《后丹》
  2. 2017-2018-2 『网络对抗技术』Exp1:PC平台逆向破解 20165335
  3. 修订模式怎么彻底关闭_电脑玩游戏卡顿怎么办?
  4. Async Program 基本知识 (Process、Thread、Context Switch)
  5. Android Studio 教程(1)----配置
  6. Linux shell的条件判断、循环语句及实例
  7. oracle多表嵌套查询使用,oracle sql 多表 嵌套子查询 连接查询, join where exist i...
  8. 《Applying Deep Learning to Answer Selection: A Study And an Open Task》文章理解小结
  9. near、far、huge,based四个个指针的区别
  10. 腾讯云dts使用注意事项
  11. phper的何去何从
  12. 明日之后哪个服务器人最多_明日之后,末日寻宝活动上线,远星城宝箱位置攻略...
  13. 税控服务器管理系统已签名未上传,增值税发票管理系统升级后发票上传失败、勾选平台插件设置、勾选签名问题、勾选规则等热点问题...
  14. 错过等一年!物流与交通的先锋碰撞,点击进入这场大佬云集的学术盛宴
  15. 极域电子书包教师端程序启动介绍
  16. SaaS第一,股价暴涨,25年的金蝶迎来第二春
  17. android 支付宝参数说明,android 支付宝 接入流程总结
  18. poj 1608 dp(Banal Ticket)
  19. ./bin/mysqld: error while loading shared libraries: libaio.so.1: cannot open shared object file:
  20. Programming Exercise5:Regularized Linera Regression and Bias v.s Variance

热门文章

  1. expected at least 1 bean which qualifies as autowire candidate. Dependency annotations: {@org.spring
  2. 校正光学系统像差原则
  3. Commun. Biol. | 人工智能加速抗生素发现
  4. RDKit | 基于RDKit的MaxMin方法选择高度多样化的库
  5. 第二十一课.GBDT
  6. R语言之字符处理(一)
  7. tkinter安装_mac pyenv 安装tkinter,解决tkinter环境的问题
  8. list对象_list对象,容量自适应的数组式容器
  9. MPB:南农成艳芬组-​瘤胃厌氧真菌代谢产物的检测方法
  10. NBT-19年2月刊4篇35分文章聚焦宏基因组研究