路面检测的多尺度网络结构论文笔记
路面检测的多尺度网络结构论文笔记
1.u-net网络结构
u-net网络具有收缩路径和扩张路径,这里的收缩和扩张指的是图像的尺寸。收缩路径由典型的3*3卷积-relu层组成,在每做两次卷积后接一个2*2的max-pooling下采样,每次下采样同时将卷积模板数量翻倍。如此经过5次下采样后,进入扩张路径,扩张路径的一步由一个上采样、对应收缩路径对应特征图拼接和两个卷积-relu层组成,上采样放大了图像的尺寸同时减半特征图通道数,对应收缩路径特征图具有更多地原图像位置信息,拼接该特征图再进行卷积提取特征有利于保留原图像的位置信息,增强预测图像的位置信息。另外由于卷积时no-padding,所以收缩路径和扩张路径对应的特征尺寸并不一致,在收缩路径特征图拼接到扩张路径特征图时需要裁剪。再最后使用1*1的卷积层输出至等于分类数channels。
关于u-net的论文值得注意的是:
- u-net网络具有使用较少的训练图像就能实现很好的图像分割能力。
- u-net网络在经过了5个下采样,损失了很多的位置细节信息,为了提高预测图像中物体位置精确度,作者在5个上采样的过程中对应地添加了收缩路径的特征图以此增加源图像细节信息。
- 论文中提到了使用镜像对称的方式来进行图像填充。
[外链图片转存失败(img-XNpOMpNL-1563722150621)(./u-net_paddingstype.PNG)]
2.本文的网络结构
2.1网络结构
这篇论文提出的网络结构是,以u-net为基础网络(在论文中没有看到关于上采样,扩张路径的描述),将卷积层改进成带identity block的残差模块,再考虑多尺度融合,将后四个卷积层输出特征图直接拼接至输出层。
2.2路面裂缝检测任务
因为图像中道路裂缝分布广泛, 并且裂缝的轮廓模糊,所以难以人工给裂缝图像每个像素地做标记。因此作者将裂缝图像分割成不重叠的块,每个块形状为100∗100100*100100∗100。
裂缝检测的任务就是给定一个未做标记的裂缝图像,判断每个块是否有裂缝。
输入图像尺寸是70400∗10880070400*10880070400∗108800,先resize,在放入神经网络中进行预测,得出34∗2234*2234∗22的预测图像,接着讲预测图像resize放大,标记在源图像上形成一次预测。
2.3论文总结
这篇论文主要还是想说多尺度对裂缝检测的作用,作者认为单尺度CNN网络具有固定的感受野,这不利于抗裂缝尺度变化的能力,并且在下采样的过程中图像中细节信息容易丢失。反过来说,多尺度融合特征有利于增强图像抗尺度变化能力,更好地利用图像细节信息。
参考
https://arxiv.org/abs/1505.04597
http://xueshu.baidu.com/usercenter/paper/show?paperid=1b0b0rc0tq0f0mr07s410p70cj715446&site=xueshu_se
路面检测的多尺度网络结构论文笔记相关推荐
- CVPR2020论文笔记——EfficientDet---双尺度特征融合BiFPN目标检测
代码:https://github.com/google/automl/tree/ master/efficientdet. 摘要:提出了提高效率的几个关键优化 提出了一种加权的双向特征金字塔网络,它 ...
- 3d object是什么文件_[单目3D目标检测论文笔记] 3D Bounding Box Estimation
本文是3D Bounding Box Estimation Using Deep Learning and Geometry的论文笔记及个人理解.这篇文章是单目图像3d目标检测的一个经典工作之一.其目 ...
- 从基础综述、论文笔记到工程经验、训练技巧:值得一看的目标检测好文推荐...
点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 本文授权转自知乎作者跑者小越,https://zhuanlan.z ...
- 论文笔记:Object Detection in 20 Years: A Surve(目标检测20年研究综述)
文章目录 1.介绍 2.目标检测的20年发展历程 2.1.目标检测路线 2.1.1.里程碑:传统检测器 2.1.2.基于CNN的两阶段检测器 2.1.3.基于CNN的单阶段检测器 2.2.目标检测数据 ...
- 文本检测-基于分割的文本检测算法论文笔记
PSENet Progressive Scale Expansion Network 渐进式规模扩展网络 1. 网络结构 论文使用resnet作为PSENet的主干网络,将特征图F映射到多个分支中,即 ...
- 图像内复制粘贴篡改取证matlab_[论文笔记] 篡改检测:RGB-N
[论文笔记] Learning Rich Features for Image Manipulation Detection 说在前面 个人心得: 第一次关注篡改检测,最常见的篡改方式是拼接.复制移动 ...
- 论文笔记:再看ResNet——ResNet典型网络结构
前言 第一次看ResNet论文的时候,由于刚接触深度学习不久,对ResNet的理解仅仅停留在论文中阐述的一些基本思想.加上当时实验室的硬件条件很有限,用的模型基本上以AlexNet和VGG为主,并没有 ...
- 《用于水稻病害检测的机器视觉系统:综述》论文笔记
<用于水稻病害检测的机器视觉系统:综述>论文笔记 链接:Machine Vision Systems for Rice Diseases Detection: A Review | IEE ...
- 论文笔记: 贝叶斯在线变点检测:An intuitive understanding
目录 0. 前言0 1. 前言 2. Overview of BOCD 3. Possible extensions 4. References 5. 后记 0. 前言0 本文是关于一篇关于贝叶斯变化 ...
最新文章
- matplotlib交互模式
- 特斯拉打响自动驾驶芯片反击战!
- 【机器学习】扎实入门机器学习的路子
- ITK:从二进制图像中提取最大的连接组件
- 原型链 —— 以隐式引用作为存储方式的单向链表
- 叫板英特尔,英伟达发布首个 CPU,集齐“三芯”!
- 刷新存储器的容量单位是什么_SRAM的容量扩展
- GMA Round 1 三视图
- express快速入门【含源码压缩包下载】
- Zigbee智能开关和单火取电技术
- 分布式数字身份的几个“非技术”思考
- android 当电脑屏幕,手机变身为电脑的第二屏幕?让你把手机当成电脑用!
- DSP TMS320C5509A 控制DDS AD9854芯片进行AM幅度调制时的噪声抑制
- 【熊猫TV】《程序员》:聚光灯下的熊猫TV技术架构演进
- [渗透教程]-001-信息收集-第三方软件
- export和import的答疑
- 我的世界服务器怎么弄领地语言,我的世界领地指令权限大全 我的世界领地指令设置教程...
- Line-based Automatic Extrinsic Calibration of LiDAR and Camera论文阅读
- 人生下来就是一个矛盾体
- Brodal queue简要说明