DMPR-PS论文简读
code:https://github.com/Teoge/DMPR-PS
文章目录
- 摘要
- DIRECTIONAL MARKING-POINT
- DMPR-PS: A PARKING-SLOT DETECTION APPROACH BASED ON DIRECTIONAL MARKING-POINT REGRESSION
- Directional marking-point regression
- Parking-slot inference
摘要
自动泊车系统在自动驾驶中发挥着重要作用,其关键问题之一是停车槽检测。这一领域以前的研究大多是基于为通用目的而设计的现成模型,这些模型在解决特定问题方面有各种局限性。本文提出了一种利用定向标记点回归的停车槽检测方法,即DMPR-PS。DMPR-PS没有使用了多个现成的模型,而是使用了一种新的基于CNN的模型,专门为方向标记点回归设计。给定一个环绕视图图像I,该模型预测了I上每个标记点的位置、形状和方向。从标记点,停车场上,我可以很容易地推断出使用几何规则。DMPR-PS优于基准数据集上ms最先进的竞争对手,精度为99.42%,召回率为99.37%,同时在英伟达泰坦Xp上实现了每帧12ms的实时检测速度。
DIRECTIONAL MARKING-POINT
定向标记点实际上是一种以标记点及其邻域为特征的局部图像模式。它有三个属性,位置、形状和方向。
Position。如上所述,标记点是标记线的连接点。然而,严格地说,标记线是具有一定宽度的线形标记。两条相交的标记线形成了一个方形的结区域。
在这里,我们定义了一个方向标记点的位置,作为这个交叉点区域的中心。
Shape.根据标记点图案的形状,各种标记点可分为T形标记点和L形标记点。如图所示。2、T形标记点的图案形状类似于字母“T”,而L形标记点的图案形状类似于字母“L”。
Orientation。由于t形标记点的图案是对称的,因此我们将其方向定义为沿对称轴的方向。至于l形标记点图案,我们将其方向定义为顺时针旋转90◦后沿标记线与其他标记线重叠的方向。方向的插图如图中的红色箭头。2
基于上述定义,方向标记点可以用四维向量来表示:
其中(x、y)表示位置,s是表示图案形状的二进制值,θ表示极坐标系下图案方向的角坐标。
DMPR-PS: A PARKING-SLOT DETECTION APPROACH BASED ON DIRECTIONAL MARKING-POINT REGRESSION
在本节中,详细介绍了我们提出的停车槽检测方法DMPR-PS。如图所示。3、DMPRPS包括两个主要步骤,方向标记点回归和停车位推理。
Directional marking-point regression
为了实现定向标记点的检测,我们提出了一种新的基于CNN的多属性回归模型,它具有专门针对定向标记点设计的回归目标。这种回归模型在上下文中被称为DMPR。
给定一个环绕视图图像I,DMPR将我分割成一个S×S图像网格,并使用CNN提取一个S×S×N特征地图。然后在反向传播期间,分配S×S×N特征图中的每个N维向量来执行进入S×S图像网格中相应单元的方向标记点的回归。
在我们的模型中,n维向量实际上由6个元素组成:cx、cy,s,cosθ、sinθ和置信度c。置信度预测了一个标记点落入该网格单元的概率。(cx、cy)预测标记点到网格单元格边界的位置。和s预测了方向标记点的形状。我们的模型没有直接预测θ,而是预测了θ的两个三角值,因为θ和sinθ,因为后者在实现中更健壮。基于cosθ和sinθ,可以直接推导出θ。
在回归目标定义后,损失函数被去细化为预测和地面事实之间的平方误差之和,并表示为以下方程式:
下标i表示S×S网格的单元格索引,用ˆ表示的符号表示预测的相应基本事实。运算符i表示一个标记点是否落入单元格i中,这意味着我们只有在有一个标记点落入该网格单元格中时,才能惩罚单元格i的标记点属性误差。
在DMPR中使用的神经网络的体系结构主要是根据当前对象检测框架的建议以及这一领域的常识来设计的。表1显示了该神经网络的配置。使用具有1×1压缩卷积和3×3扩展卷积的瓶颈块作为我们网络的基本构建块。
Parking-slot inference
在检测到方向标记点并施加非最大抑制后,可以从检测到的标记点推断出停车位。该推理过程包括两个步骤,不适当的标记点对滤波和定向标记点配对。
在进行定向标记点对之前,必须过滤不适当的标记点对。首先,一对标记点的距离应满足距离约束。例如,在图中。4、P1和P2是一对被检测到的标记点。但显然,它们并没有形成一条有效的入口线,因为它们之间的空间太窄,汽车无法停在里面。为了排除这种无效情况,获得了两个入口线距离范围,分别对应于垂直停车场和平行停车场,作为先验知识。然后将它们作为距离约束,过滤出距离不合适的标记点对。其次,通过第三点的标记点对需要被滤掉。在图中。4、对于标记点P2和P4,虽然它们的方向和形状满足入口线的有效情况之一,但它们不能形成有效的入口线,因为它们不相邻。我们可以通过检查它们形成的入口线上是否有第三个标记点来排除这些无效的案例。对于标记点P2和P4,第三点P3位于P2和P4之间,因此它们不能形成有效的入口线。
过滤掉不合适的标记点对后,发送剩余的对以确定它们是否符合停车场入口的有效情况之一。如图所示。5、对于形成入口线的一对标记点(A、B),两个标记点可分为5例,如图(1)∼(5)所示。然后,对于这5个标记点的案例,有16个组合,其中两个标记点形成了一个有效的入口线。这16种组合对应于图所示的16种有效的入口线情况。6.因此,对于每一个标记点对,我们首先通过比较形状和方向来确定这两个标记点是否属于5个标记点案例中的一个,然后确定这两个标记点的组合是否与16个有效案例中的一个匹配。如果满足这两个条件,我们可以认为这两个标记点形成了一个有效的入口线,并且可以确定一个有序的标记点对。因此,最终可以找到这条入口线的相应的停车位。
DMPR-PS论文简读相关推荐
- SOLOv2论文简读
论文:SOLOv2: Dynamic, Faster and Stronger 代码:https://github.com/WXinlong/SOLO 摘要 主要提出了作者在SOLOv2中实现的优秀的 ...
- 边缘检测论文简读、开源代码和数据集合集
文章目录 概述 基于深度学习的边缘检测 一般的边缘检测 2019 Object Contour and Edge Detection with RefineContourNet Edge-Direct ...
- FairFuzz 论文简读+源码分析+整体流程简述
FairFuzz: A Targeted Mutation Strategy for Increasing Greybox Fuzz Testing Coverage 一.论文阅读 Abstract ...
- Extending IOU Based Multi-Object Tracking by Visual Information论文简读
写在前面 这篇论文是在方法"High-speed tracking-by-detection without using image information"(IoU)基础上的改进 ...
- 高质量的超高分辨率图像分割(论文简读)
code: https://github.com/dvlab-research/Entity 文章目录 1 abstract 2 Introduction 3 Proposed Method 3.1 ...
- 【没有哪个港口是永远的停留~ 论文简读】Relational Knowledge Distillation
论文:Relational Knowledge Distillation [1]关系知识蒸馏,中的关系知识是啥? 如图1,很明显就是字面意思,传统的知识蒸馏是让学生输出与教师模型一致,而本论文提出,输 ...
- 超高分辨率图像内存高效分割的协同全局局部网络论文简读
code: https://paperswithcode.com/paper/190506368 文章目录 1摘要 2论文的贡献 3协作性的全局-局部网络 3.1 Motivation: Why No ...
- 【没有哪个港口是永远的停留~ 论文简读】2019 Distilling Object Detectors with Fine-grained Feature Imitation
链接:2019 Distilling Object Detectors with Fine-grained Feature Imitation 代码:https://github.com/twangn ...
- 【论文简读】Diffusion Kernel Attention Network for Brain Disorder Classification用于脑疾病分类的扩散核注意力网络
期刊:MIA 2022 early accept 作者:Jianjia Zhang, Luping Zhou, Lei Wang, Mengting Liu and Dinggang Shen 摘要 ...
最新文章
- Alphabet股价周五跌5.32%:三年最大单日跌幅
- LeetCode 456 132 Pattern
- java是解释型编程语言_程序设计语言可以分为两类:编译型语言和解释型语言...
- 怎么去掉Flex4生成的SWF加载时的进度条
- 趣谈预留实例券,一文搞懂云上省钱最新玩法
- 1 利用Anaconda完美解决Python 2与python 3的共存问题
- 从零开始学习音视频编程技术(六) FFMPEG Qt视频播放器之显示图像
- C++之指针探究(一):一级指针和二级指针
- 【Caffe代码解析】compute_image_mean
- 什么是JavaWeb,主要框架有哪些
- Java设计模式学习记录-模板方法模式
- 抓包工具神器,fiddler全解
- 缓冲区,缓存,fflush(stdin)如何使用?
- 选型宝访谈:打造细胞级的IT透视能力,构建健壮的业务运维体系!
- Flutter加载大图内存问题处理
- 2021年人工智能(AI)的五大发展方向
- MySQL Manual
- Eclipse+git中merge代码时出现conflict(冲突)的问题解决方案
- 从零开始搭建一个HTTPS网站
- 达梦数据库linux安装
热门文章
- T149基于51单片机4层电梯控制器Proteus设计、keil程序、c语言、源码
- Vue中 前端实现生成 PDF 并下载
- 数据库之《会员管理系统》
- Mac 版 Vysor 1.8.2破解 以及下载
- 分众模式下的学员管理
- Ubuntu登陆不进去的一个原因
- 2021年1月程序员工资统计,平均14915元
- pat乙级 1072 开学寄语 (20 分)C
- 数据仓库之【用户行为数仓】11:【dws层:数据汇总层】【appc层:数据应用层】需求4:每日启动App次数相关指标
- Atlassian 系列软件安装(Crowd、jira、confluence、bitbucket、bamboo)