论文解读 CSRNet: Dilated Convolutional Neural Networks for Understanding the Highly Congested Scenes
abstract
1.提出CSRNet是为了处理非常密集的场景,提供准确的计数和密度图
2.提出的CSRNet主要两部分组成:提取二维特征的CNN做前端,膨胀的CNN做后端,膨胀的卷积核是为了获得更大的感受野,取代池化操作。
3.在四个人群数据集都获得了很好的结果,并且在交通的数据集上也有很好的表现
introduction
1.密度图的重要性:同样的人数可能有完全不同的分布。
2.产生密度图的困难之处在于:
- 预测方式:逐像素预测,相邻像素有空间相关性
- 多样化的场景
3.深度神经网络在其他cv任务上表现出优势,硬件上也有优势,适用于密度估计。
4.多尺度结构的劣势:训练时间长+无效分支结构,实验说明分支无效性
5.介绍CSRNet的大致结构及在各数据集上取得的结果:为了降低网络复杂度,只使用3*3的卷积;前10层是VGG-16;后面是膨胀卷积层
6.介绍文章结构
related work
- 基于检测的方法
- 基于回归的方法
- 基于密度估计的方法
- 基于卷积神经网络的方法
- 目前state-of-the-art方法的缺陷:基于MCNN结构,出现以下问题:难训练;结构冗余;图片输入MCNN前需要根据密度分级,分级很难且分类器增加网络的冗余;密度分级占了很多参数,导致密度图生成的精度降低
proposed solution
CSRNet architecture
1.其他网络使用VGG-16的劣势,介绍本文如何利用VGG-16:前段网络利用VGG-16,首先移除分类部分(fc层),利用卷积层构建CSRNet,前端网络输出的大小是输入图片的1/8。为了保证高精度,不再堆叠卷积层和池化层,转而使用膨胀CNN做后端
dilated convolution
膨胀卷积的定义如上。下图更好理解一些。
膨胀卷积的好处在于扩展的感受野的同时并没有增加参数,聚合多尺度空间信息时,保持同样的分辨率。
最后举例说明膨胀卷积的好处。
network configuration
提出了四种网络的配置,具体网络结构如下:
要把握精确度和资源消耗的平衡,结构细节最终是由实验确定的。利用双线性插值将CSRNet输出的原图1/8大小的密度图恢复到原图大小。
training method
1.真值图生成时人头大小取到某人头到k个最近邻的人头距离的平均值
2.数据增强:常规的裁剪、镜像操作
3.训练细节:随机梯度下降法+欧式距离
experiments
1.介绍评价指标:MAE/MSE
2.ablation:比较不同的膨胀率给网络带来的影响,膨胀率为2的时候最好
3.分别在五个数据集上和其他方法进行比较,遵循先介绍数据集,再介绍实验结果的写作方法。其中TRANCOS是一个交通数据集,评价指标使用GAME
conclusion
1.CSRNet:产生高质量的密度图,便于训练
2.膨胀卷积:整合多尺度的上下文信息,不损失精度的前提下扩展感受野
3.CSRNet方法有一般性
论文解读 CSRNet: Dilated Convolutional Neural Networks for Understanding the Highly Congested Scenes相关推荐
- 论文学习笔记:CSRNet: Dilated Convolutional Neural Networks for Understanding the Highly Congested Scenes
CSRNet是2018年提出来的人群计数模型,其论文发表于CVPR会议. 论文链接:CSRNet Abstract 摘要 我们提出了一个拥挤场景识别网络CSRNet,它提供了一种数据驱动的深度学习方法 ...
- 人群密度估计--CSRNet: Dilated Convolutional Neural Networks for Understanding the Highly Congested Scenes
CSRNet: Dilated Convolutional Neural Networks for Understanding the Highly Congested Scenes CVPR2018 ...
- CSRNet: Dilated Convolutional Neural Networks for Understanding the Highly Congested Scenes
本文首先针对MCNN,提出了其两个缺点:大量的训练时间和无效的分支架构. MCNN由于使用了多列网络,参数比较多,需要训练时间长容易理解.可是作者为什么说MCNN的多列是"无效的分支&quo ...
- 2018_Csrnet: Dilated convolutional neural networks for understanding the highly congested scenes
Csrnet: Dilated convolutional neural networks for understanding the highly congested scenes 说明 概括 一. ...
- CSRNet: Dilated Convolutional Neural Networks for Understanding the Highly Congested Scenes2018—论文笔记
本论文来自CVPR2018, 读于20190409. Abstract 我们提出的Congested Scene Recognition(CSRNet)包含了两个部分,一个是获得二维特征的前端,一个是 ...
- CRSNet: Dilated Convolutional Neural Networks for Underatanding the Highly Congested Scenes
CRSNet: Dilated Convolutional Neural Networks for Underatanding the Highly Congested Scenes 针对复杂场景拥挤 ...
- 人群计数:CSRNet-Dilated Convolutional Neural Networks for Understanding the Highly Congested Scenes
(鉴于有朋友提到模型去哪里下载的问题,这里多加一句) CSRNet 官方GitHub地址:https://github.com/leeyeehoo/CSRNet-pytorch 这里面包括代码和训练好 ...
- 小波变换到小波网络理解+论文解读《Wavelet Convolutional Neural Networks》
连续小波变换最大的特点是什么 多分辨分析肯定是标准答案.所谓多分辨分析即是指小波在不同频率段会有不同的分辨率 由图,我们可以看出,低频时(频率为4),对应彩色条纹更细,意味着更高的频率分辨率,而条纹区 ...
- DEEPCON: protein contact prediction using dilated convolutional neural networks with dropout
今天真的要开始正式进入科研状态了,之前一直都进入失败,咳!那就先来看一篇相关领域的论文吧 ---------------------------------------------- 题目:DEEPC ...
最新文章
- torch.nn.Embedding理解
- python 打开网页 并填表单_Windows下使用python3 + selenium.webdriver功能实现自动填写网页表单功能...
- 最适合做老婆主播不是Rita?不是豚豚,也不是纪小鹿,是她
- iOS瀑布流实现(Swift)
- asp.net core系列 71 Web架构分层指南
- 德勤发布2020技术趋势报告,五个新趋势可引发颠覆性变革
- python程序需要编译么_python需要编译么
- showdoc如何创建文件夹_showDoc生成文档
- [2005.04.24 20:47:26] 实践与思考之窥索[原创]
- 我如何知道Bash脚本中的脚本文件名?
- python适合自学编程吗-风变编程:Python适合编程初学者学习吗?
- [转]RDLC 动态列
- Js中对URL进行转码与解码
- CnOpenData国际货物贸易数据
- Python3中.whl文件介绍
- 打开计算机显示远程控制,win7系统远程协助怎么打开?开启远程协助功能教程...
- NO pyvenv.cfg file解决办法
- CMD控制台(命令提示符)的打开方式
- 即插即涨2-3%!AC-FPN:用于目标检测的注意力引导上下文的特征金字塔网络
- 桌面计算机没反应是什么意思,点击显示桌面没反应? 显示桌面没反应解决方法...
热门文章
- 随机阶跃信号发生Matlab源码
- 函数 - 计算机函数
- CCSA EE-SCMS接口ASN数据结构示意
- 网吧计算机工作流程,网吧管理之工作流程篇
- 基于springboot+vue的房屋出租租赁系统 elementui
- aws搭建java项目_开发人员指南 - AWS SDK for Java 1.x - 适用于 Java 的 AWS 开发工具包...
- windows上安装pylon
- 【组网工程】cisco packet tracer 交换机组网
- 六年级计算机机器人考试试题,小学六年级信息技术期末试题
- 后台数据已经传好JSON数据,前台页面却加载不出来或者是显示正在加载中?