论文阅读-多任务(2021)-YOLOP:用于自动驾驶目标检测与语义分割的实时多任务模型
YOLOP
论文:YOLOP: You Only Look Once for Panoptic Driving Perception
地址:https://paperswithcode.com/paper/yolop-you-only-look-once-for-panoptic-driving
论文阅读
YOLOP同时处理三项视觉感知任务+实时速度运行(Jetson TX2-23FPS)+保持较高精度
关于方法详情,如下图所示,全景驾驶场景感知网络YOLOP包括一个共享的编码器和三个特定的解码器处理不同任务,解码器之间没有复杂的共享机制,保证网络的端到端高效训练。
对于编码器,包含一个主干和一个neck,其中主干网络用于提取输入图像的特征,通常是选用图像分类网络,但是论文受YOLOv4的启发选用了CSPDarknet来作为主干,该主干有效解决了优化过程的梯度冗余问题,支持特征的高效传播和服用,满足模型对于实时的要求。
对于Neck,起作用在于融合主干网络生成的特征,YOLOP的neck由空间金字塔池化模块SPP和特征金字塔网络FPN组成。SPP生成并融合不同尺度的特征,FPN则融合不同语义层级的特征,使得生成的特征包含多尺度和多个语义层级的信息。
对于解码器,有三个,分别是交通目标检测头、可通行区域分割头和车道线分割头,后两者使用结构相同的分割头。
对于检测头,和YOLOv4相同,采用基于anchor的多尺度检测策略。首先使用通路聚合网络PAN(自底而上的特征金字塔网络)。FPN自顶而下传递语义特征,PAN自底而上传递位置特征,论文将二者结合以便产生更好的特征融合效果,之后直接在PAN种使用融合有多尺度信息的特征图进行检测。然后每个多尺度特征图的grid都会标记三个不同比例的先验框,然后检测头对位置偏移量、框尺寸以及类别标签进行预测。
对于分割头,论文奖FPN的输出(W/8,H/8,256W/8,H/8,256W/8,H/8,256)直接灌给分割头,经过三次三次上采样后输出预测结果(W,H,2)(W,H,2)(W,H,2),因为SPP模块已经在共享的neck种一个用,这里不需要额外的SPP模块。
训练目标
对于损失函数,检测头的损失函数:
Ldet=α1Lclass+α2Lobj+α3LboxL_{det}=\alpha_1 L_{class}+\alpha_2 L_{obj}+\alpha_3 L_{box} Ldet=α1Lclass+α2Lobj+α3Lbox
其中前两者都是focal loss,使得网络更多关注难样本,第三个是LCIoUL_{CIoU}LCIoU,该损失考虑了Pred和GT之间的距离、重叠率、anchor尺寸和比例.
分割头的损失有两个即可通行区域分割头损失Lda−segL_{da-seg}Lda−seg和车道线分割损失Lll−segL_{ll-seg}Lll−seg,二者都包含一个交叉熵损失LceL_{ce}Lce用于最小化Pred和GT之间的像素分类误差,道路损失还额外包含一个IoU损失LIoU=TNTN+FP+FNL_{IoU}=\frac{TN}{TN+FP+FN}LIoU=TN+FP+FNTN。
最终模型的损失是一个带权复合损失:
Lall=γ1Ldet+γ2Ldaseg+γ3Lll−segL_{all}=\gamma_1 L_{det}+\gamma_2 L_{da_seg}+\gamma_3 L_{ll-seg} Lall=γ1Ldet+γ2Ldaseg+γ3Lll−seg
训练的时候,先冻结模型其他部分权重,只训练编码器和检测头,然后冻结主干和检测头训练两个分割头,最终整个网络联合训练。
欢迎扫描二维码关注微信公众号 深度学习与数学 ,每天获取免费的大数据、AI等相关的学习资源、经典和最新的深度学习相关的论文研读,算法和其他互联网技能的学习,概率论、线性代数等高等数学知识的回顾。
论文阅读-多任务(2021)-YOLOP:用于自动驾驶目标检测与语义分割的实时多任务模型相关推荐
- CVPR 2022 57 篇论文分方向整理 + 打包下载|涵盖目标检测、语义分割、人群计数、异常检测等方向
CVPR2022论文速递系列: CVPR 2022 3月3日论文速递(22 篇打包下载)涵盖网络架构设计.姿态估计.三维视觉.动作检测.语义分割等方向 CVPR 2022 3月4日论文速递(29 篇打 ...
- 自动驾驶深度多模态目标检测和语义分割:数据集、方法和挑战
自动驾驶深度多模态目标检测和语义分割:数据集.方法和挑战 原文地址:https://arxiv.org/pdf/1902.07830.pdf Deep Multi-Modal Object Detec ...
- CV Code | 本周新出计算机视觉开源代码汇总(含自动驾驶目标检测、医学图像分割、风格迁移、语义分割、目标跟踪等)...
点击我爱计算机视觉标星,更快获取CVML新技术 刚刚过去的一周含五一假期,工作日第一天,CV君汇总了过去一周计算机视觉领域新出的开源代码,涉及到自动驾驶目标检测.医学图像分割.风格迁移.神经架构搜索. ...
- [自动驾驶-目标检测] C++ PCL 障碍物检测
文章目录 1 文章引言 2 难点分析 3 初期思路 4 初期展示(Kitti数据集) 5 初步方案 5.1 栅格化 5.2 地面分割 5.2 点云聚类 6 参考文献 1 文章引言 由于时间原因,3D检 ...
- 目标检测YOLO实战应用案例100讲-基于深度学习的自动驾驶目标检测算法研究
目录 基于深度学习的自动驾驶目标检测算法研究 相关理论基础 2.1 卷积神经网络基本原理
- [自动驾驶-目标检测] C++ PCL 连通域点云聚类
文章目录 引言 标签连通域聚类原理 Octree + LCC 代码实现 Octree + LCC 测试结果 Octree + LCC 的优缺点 改进思路 参考文献 引言 在实际实现3D目标检测时,在不 ...
- FlyAI小课堂:深度学习论文翻译解析(3):丰富的特征层次结构,可实现准确的目标检测和语义分割
论文标题:Rich feature hierarchies for accurate object detection and semantic segmentation 标题翻译:丰富的特征层次结构 ...
- CVPR2019 | 15篇论文速递(涵盖目标检测、语义分割和姿态估计等方向)
[导读]CVPR 2019 接收论文列表已经出来了,但只是一些索引号,所以并没有完整的论文合集.CVer 最近也在整理收集,今天一文涵盖15篇 CVPR 2019 论文速递,内容涵盖目标检测.语义分割 ...
- 复杂背景下的自动驾驶目标检测数据集
复杂背景下的目标检测数据集: 一.有雾场景下的目标检测数据集 发展: 2017年Li等提出第 1 个端到端的去雾网络 AODNet, 并且讨论了图像去雾对目标检测任务的影响. 其选取目标检测网络 Fa ...
- 使用 YOLOv5 训练自动驾驶目标检测网络
本文会详细介绍YOLO V5的网络结构及组成模块,并使用YOLO V5s在BDD100K自动驾驶数据集上进行迁移学习,搭建属于自己的自动驾驶交通物体对象识别网络. 本文来源:知乎-自动驾驶全栈工程师 ...
最新文章
- slot没有毁灭的问题_解析flink之perjob模式下yn参数不生效问题
- My Site Cleanup Job
- oracle学习笔记(二)------函数
- 来个硬货——长文解读:基于业务场景的MySQL千万级大表优化
- python审计ssh_代码分享:用Python编写的多协议弱密码审计工具集
- Bloom Filter算法
- 跨性别,你所不知道的事
- c语言判断字符是汉字,c语言里面判断字符是否为汉字
- 信息学奥赛一本通 1017:浮点型数据类型存储空间大小 | OpenJudge NOI 1.2 02
- 水晶报表 mysql_水晶报表CrystalReport2008使用JDBC连接MySQL数据库-详细步骤
- 软件工程学习进度第五周暨暑期学习进度之第五周汇总
- 排球计分程序功能说明书
- FFMPEG模拟直播源
- 电脑故障维修:笔记本没有声音,右下角音量有红叉,“英特尔(R)智音技术OED“出现黄色叹号。
- IDCC2018|北京福通四维科技有限公司副总经理胡海山:顺鑫集团智慧农业领域深耕的数据化转型之路...
- 实时渲染——三种渲染方法介绍
- 网络流(二) 最大流算法的实现
- 按键精灵sayString不生效
- 右键-打开方式里没有EXCEL,找到路径也打不开的解决方法
- php 正则 括号内容_PHP怎么实现正则匹配所有括号中的内容