CRSNet: Dilated Convolutional Neural Networks for Underatanding the Highly Congested Scenes

针对复杂场景拥挤场景理解提出了一个CSRNet,该网络主要包含两个部分,前端使用一个卷积网络用于2D特征提取,后端采用一个dilated CNN.该网络在几个公开人群密度估计数据库上取得了不错的效果。

拥挤场景解析的发展从简单的人群数值估计到人群密度图估计,人群密集图可以提供额外的信息,因为同样数量的人可以分布在不同位置。

人在图像中不是只占用一个像素面密度图需要保持局部邻域的连续性。

以non-effctive bran前基于CNN网络的人群密度估计主要采用了multi-scale architectures,存在两个问题:当网络变深时,the large amount of training time and non-effective branch structure. A deeper,regular network with the similar amount of parameters.

人群密度估计方法:

  1. detection-based methods
  2. regression-based methods
  3. density estimation-based methods
  4. The fundamental idea of the proposed design is to deploy a deeper CNN for capturing high-level features with larger receptive fields and generating high-quality density maps without brutally expanding network complexity.

CSRNet architecture

前端采用VGG-16

Abstract: The proposed CSRNet is composed of two major components: a convolutional neural network CNN as the font-end for 2D feature extraction and a dilated CNN for the back-end,which uses dilated kernels to deliver larger reception fields and to replace pooling operations.

1. Intorduction

It’s challenging to generate accurate distribution patterns.One major difficulty comes from the prediction manner,多尺度的方法不够好,两个主要的问题,讨论深度模型。三条支路出来的结果都是类似的,这就背离了多尺度之前的初衷,用来学习不同的特征。

In this paper,we design a deeper network called CSRNet for counting crowed and generating high-quality density maps.使用来自VGG16的前十层作为前端,使用dilated 卷积作为后端去扩大接受域和在没有分辨率损失的条件下提取深度特征,pooling操作是没有被使用的。

2. Related work

多尺度结构并不能有效的提取不同级别的特征,相反提取的特征大多是相似的,因此不建议采用多尺度

3. Proposed solution

3.1 CRSNet architectures

面使用VGG,出来之后是原图的1/64,后面使用dilated convolution,在保持分辨率上,dilated convolution展示了清晰的优势相比较于使用convolution + pooling + deconvolution.The output is shared the same dimension as the input(meaning pooling and deconvolutional layers are not required).Most importantly,the output from dilated convolution contains more detailed information.

3.2 Training methods

MAE,MSE

https://github.com/tlokeshkumar/CSRNet-tf

input pipline we use is an efficient Data API pipline for parsing tfrecoeds files.

CRSNet: Dilated Convolutional Neural Networks for Underatanding the Highly Congested Scenes相关推荐

  1. 人群密度估计--CSRNet: Dilated Convolutional Neural Networks for Understanding the Highly Congested Scenes

    CSRNet: Dilated Convolutional Neural Networks for Understanding the Highly Congested Scenes CVPR2018 ...

  2. 论文学习笔记:CSRNet: Dilated Convolutional Neural Networks for Understanding the Highly Congested Scenes

    CSRNet是2018年提出来的人群计数模型,其论文发表于CVPR会议. 论文链接:CSRNet Abstract 摘要 我们提出了一个拥挤场景识别网络CSRNet,它提供了一种数据驱动的深度学习方法 ...

  3. 2018_Csrnet: Dilated convolutional neural networks for understanding the highly congested scenes

    Csrnet: Dilated convolutional neural networks for understanding the highly congested scenes 说明 概括 一. ...

  4. 论文解读 CSRNet: Dilated Convolutional Neural Networks for Understanding the Highly Congested Scenes

    abstract 1.提出CSRNet是为了处理非常密集的场景,提供准确的计数和密度图 2.提出的CSRNet主要两部分组成:提取二维特征的CNN做前端,膨胀的CNN做后端,膨胀的卷积核是为了获得更大 ...

  5. CSRNet: Dilated Convolutional Neural Networks for Understanding the Highly Congested Scenes

    本文首先针对MCNN,提出了其两个缺点:大量的训练时间和无效的分支架构. MCNN由于使用了多列网络,参数比较多,需要训练时间长容易理解.可是作者为什么说MCNN的多列是"无效的分支&quo ...

  6. CSRNet: Dilated Convolutional Neural Networks for Understanding the Highly Congested Scenes2018—论文笔记

    本论文来自CVPR2018, 读于20190409. Abstract 我们提出的Congested Scene Recognition(CSRNet)包含了两个部分,一个是获得二维特征的前端,一个是 ...

  7. 人群计数:CSRNet-Dilated Convolutional Neural Networks for Understanding the Highly Congested Scenes

    (鉴于有朋友提到模型去哪里下载的问题,这里多加一句) CSRNet 官方GitHub地址:https://github.com/leeyeehoo/CSRNet-pytorch 这里面包括代码和训练好 ...

  8. DEEPCON: protein contact prediction using dilated convolutional neural networks with dropout

    今天真的要开始正式进入科研状态了,之前一直都进入失败,咳!那就先来看一篇相关领域的论文吧 ---------------------------------------------- 题目:DEEPC ...

  9. 有效感受野--Understanding the Effective Receptive Field in Deep Convolutional Neural Networks

    Understanding the Effective Receptive Field in Deep Convolutional Neural Networks NIPS 2016 本文主要分析了 ...

最新文章

  1. Elasticsearch分布式一致性原理剖析(一)-节点篇
  2. 【转载】flash时间轴中变量的作用域
  3. 项目管理之需求调研感悟
  4. file watchers怎么默认打开_Python读写文件怎么和我之前学的不一样?
  5. 消费类电子认证测试资料清单
  6. keras训练完以后怎么预测_还在使用“龟速”的单显卡训练模型?动动手,让TPU节省你的时间...
  7. SP1811-Longest Common Substring【SAM】
  8. 计算机改计数器的方法,第五章定时器计数器(修改)-计算机原理及应用资源共享课.ppt...
  9. java studentmanager_StudentManager.java
  10. java jws-_为JWS应用程序启动指定JRE位置
  11. 1、检测是用那个浏览器打开的
  12. 31.go 函数式编程
  13. 华为开通api服务_入冬第一场技术盛宴!DevRun开发者沙龙华为云武汉专场举办
  14. 【图像分割】基于matlab随机游走算法图像分割【含Matlab源码 149期】
  15. 5个 GIS空间分析 空间查询与量算 的重要知识点
  16. java jdk运行_JDK如何运行
  17. 换硬币 (20 分)
  18. android 基带版本,扫盲贴:手机基带版本到底是什么???
  19. php函数 chm,php函数手册 chm格式_PHP教程_源雷技术空间
  20. 麒麟linux代码行界面颜色,查看“麒麟”的源代码

热门文章

  1. 从本地html提取表格,如何从这个网页提取表格数据,做成电子表格呢?谢谢
  2. apollo5.5.0技术文档
  3. 各个数据库的默认端口号以及驱动和链接url
  4. Ubuntu18.04+ROS Melodic+RealsenseD435i+Robotiq-2F-85+UR5真实机械臂手眼标定(眼在手外)
  5. opencv读取摄像头数据有黑边
  6. 仓库选址 matlab,仓库选址的基本方法.ppt
  7. PROTEUS 使用
  8. FAQ_全志平台Tina3.0.7 RXXX cowbell方案启动时cpufreq报错且无法生成cpufreq节点
  9. 4、Cas Server的配置文件
  10. 618购物狂欢节来袭,教你跨境电商直播带货5大技巧