YOLOP

论文:YOLOP: You Only Look Once for Panoptic Driving Perception

地址:https://paperswithcode.com/paper/yolop-you-only-look-once-for-panoptic-driving

论文阅读

  YOLOP同时处理三项视觉感知任务+实时速度运行(Jetson TX2-23FPS)+保持较高精度

  关于方法详情,如下图所示,全景驾驶场景感知网络YOLOP包括一个共享的编码器和三个特定的解码器处理不同任务,解码器之间没有复杂的共享机制,保证网络的端到端高效训练。

  对于编码器,包含一个主干和一个neck,其中主干网络用于提取输入图像的特征,通常是选用图像分类网络,但是论文受YOLOv4的启发选用了CSPDarknet来作为主干,该主干有效解决了优化过程的梯度冗余问题,支持特征的高效传播和服用,满足模型对于实时的要求。

  对于Neck,起作用在于融合主干网络生成的特征,YOLOP的neck由空间金字塔池化模块SPP和特征金字塔网络FPN组成。SPP生成并融合不同尺度的特征,FPN则融合不同语义层级的特征,使得生成的特征包含多尺度和多个语义层级的信息。

  对于解码器,有三个,分别是交通目标检测头、可通行区域分割头和车道线分割头,后两者使用结构相同的分割头。

  对于检测头,和YOLOv4相同,采用基于anchor的多尺度检测策略。首先使用通路聚合网络PAN(自底而上的特征金字塔网络)。FPN自顶而下传递语义特征,PAN自底而上传递位置特征,论文将二者结合以便产生更好的特征融合效果,之后直接在PAN种使用融合有多尺度信息的特征图进行检测。然后每个多尺度特征图的grid都会标记三个不同比例的先验框,然后检测头对位置偏移量、框尺寸以及类别标签进行预测。

  对于分割头,论文奖FPN的输出(W/8,H/8,256W/8,H/8,256W/8,H/8,256)直接灌给分割头,经过三次三次上采样后输出预测结果(W,H,2)(W,H,2)(W,H,2),因为SPP模块已经在共享的neck种一个用,这里不需要额外的SPP模块。

训练目标

  对于损失函数,检测头的损失函数:

Ldet=α1Lclass+α2Lobj+α3LboxL_{det}=\alpha_1 L_{class}+\alpha_2 L_{obj}+\alpha_3 L_{box} Ldet​=α1​Lclass​+α2​Lobj​+α3​Lbox​

  其中前两者都是focal loss,使得网络更多关注难样本,第三个是LCIoUL_{CIoU}LCIoU​,该损失考虑了Pred和GT之间的距离、重叠率、anchor尺寸和比例.

  分割头的损失有两个即可通行区域分割头损失Lda−segL_{da-seg}Lda−seg​和车道线分割损失Lll−segL_{ll-seg}Lll−seg​,二者都包含一个交叉熵损失LceL_{ce}Lce​用于最小化Pred和GT之间的像素分类误差,道路损失还额外包含一个IoU损失LIoU=TNTN+FP+FNL_{IoU}=\frac{TN}{TN+FP+FN}LIoU​=TN+FP+FNTN​。

  最终模型的损失是一个带权复合损失:

Lall=γ1Ldet+γ2Ldaseg+γ3Lll−segL_{all}=\gamma_1 L_{det}+\gamma_2 L_{da_seg}+\gamma_3 L_{ll-seg} Lall​=γ1​Ldet​+γ2​Ldas​eg​+γ3​Lll−seg​

  训练的时候,先冻结模型其他部分权重,只训练编码器和检测头,然后冻结主干和检测头训练两个分割头,最终整个网络联合训练。


欢迎扫描二维码关注微信公众号 深度学习与数学 ,每天获取免费的大数据、AI等相关的学习资源、经典和最新的深度学习相关的论文研读,算法和其他互联网技能的学习,概率论、线性代数等高等数学知识的回顾。

论文阅读-多任务(2021)-YOLOP:用于自动驾驶目标检测与语义分割的实时多任务模型相关推荐

  1. CVPR 2022 57 篇论文分方向整理 + 打包下载|涵盖目标检测、语义分割、人群计数、异常检测等方向

    CVPR2022论文速递系列: CVPR 2022 3月3日论文速递(22 篇打包下载)涵盖网络架构设计.姿态估计.三维视觉.动作检测.语义分割等方向 CVPR 2022 3月4日论文速递(29 篇打 ...

  2. 自动驾驶深度多模态目标检测和语义分割:数据集、方法和挑战

    自动驾驶深度多模态目标检测和语义分割:数据集.方法和挑战 原文地址:https://arxiv.org/pdf/1902.07830.pdf Deep Multi-Modal Object Detec ...

  3. CV Code | 本周新出计算机视觉开源代码汇总(含自动驾驶目标检测、医学图像分割、风格迁移、语义分割、目标跟踪等)...

    点击我爱计算机视觉标星,更快获取CVML新技术 刚刚过去的一周含五一假期,工作日第一天,CV君汇总了过去一周计算机视觉领域新出的开源代码,涉及到自动驾驶目标检测.医学图像分割.风格迁移.神经架构搜索. ...

  4. [自动驾驶-目标检测] C++ PCL 障碍物检测

    文章目录 1 文章引言 2 难点分析 3 初期思路 4 初期展示(Kitti数据集) 5 初步方案 5.1 栅格化 5.2 地面分割 5.2 点云聚类 6 参考文献 1 文章引言 由于时间原因,3D检 ...

  5. 目标检测YOLO实战应用案例100讲-基于深度学习的自动驾驶目标检测算法研究

    目录 基于深度学习的自动驾驶目标检测算法研究 相关理论基础 2.1  卷积神经网络基本原理

  6. [自动驾驶-目标检测] C++ PCL 连通域点云聚类

    文章目录 引言 标签连通域聚类原理 Octree + LCC 代码实现 Octree + LCC 测试结果 Octree + LCC 的优缺点 改进思路 参考文献 引言 在实际实现3D目标检测时,在不 ...

  7. FlyAI小课堂:深度学习论文翻译解析(3):丰富的特征层次结构,可实现准确的目标检测和语义分割

    论文标题:Rich feature hierarchies for accurate object detection and semantic segmentation 标题翻译:丰富的特征层次结构 ...

  8. CVPR2019 | 15篇论文速递(涵盖目标检测、语义分割和姿态估计等方向)

    [导读]CVPR 2019 接收论文列表已经出来了,但只是一些索引号,所以并没有完整的论文合集.CVer 最近也在整理收集,今天一文涵盖15篇 CVPR 2019 论文速递,内容涵盖目标检测.语义分割 ...

  9. 复杂背景下的自动驾驶目标检测数据集

    复杂背景下的目标检测数据集: 一.有雾场景下的目标检测数据集 发展: 2017年Li等提出第 1 个端到端的去雾网络 AODNet, 并且讨论了图像去雾对目标检测任务的影响. 其选取目标检测网络 Fa ...

  10. 使用 YOLOv5 训练自动驾驶目标检测网络

    本文会详细介绍YOLO V5的网络结构及组成模块,并使用YOLO V5s在BDD100K自动驾驶数据集上进行迁移学习,搭建属于自己的自动驾驶交通物体对象识别网络. 本文来源:知乎-自动驾驶全栈工程师 ...

最新文章

  1. slot没有毁灭的问题_解析flink之perjob模式下yn参数不生效问题
  2. My Site Cleanup Job
  3. oracle学习笔记(二)------函数
  4. 来个硬货——长文解读:基于业务场景的MySQL千万级大表优化
  5. python审计ssh_代码分享:用Python编写的多协议弱密码审计工具集
  6. Bloom Filter算法
  7. 跨性别,你所不知道的事
  8. c语言判断字符是汉字,c语言里面判断字符是否为汉字
  9. 信息学奥赛一本通 1017:浮点型数据类型存储空间大小 | OpenJudge NOI 1.2 02
  10. 水晶报表 mysql_水晶报表CrystalReport2008使用JDBC连接MySQL数据库-详细步骤
  11. 软件工程学习进度第五周暨暑期学习进度之第五周汇总
  12. 排球计分程序功能说明书
  13. FFMPEG模拟直播源
  14. 电脑故障维修:笔记本没有声音,右下角音量有红叉,“英特尔(R)智音技术OED“出现黄色叹号。
  15. IDCC2018|北京福通四维科技有限公司副总经理胡海山:顺鑫集团智慧农业领域深耕的数据化转型之路...
  16. 实时渲染——三种渲染方法介绍
  17. 网络流(二) 最大流算法的实现
  18. 按键精灵sayString不生效
  19. 右键-打开方式里没有EXCEL,找到路径也打不开的解决方法
  20. php 正则 括号内容_PHP怎么实现正则匹配所有括号中的内容

热门文章

  1. iview在项目中遇到的坑
  2. simple-word-Highlighter 支持网址正则表达式匹配
  3. [C++]动态规划系列之币值最大化
  4. eclipse 使用问题
  5. 《第一本docker书》第4章 使用docker镜像和仓库 读书笔记
  6. ios学习笔记——对象归档
  7. asp网络编程:用ASP构建音乐服务器的方法
  8. 转iPhone开发的门槛
  9. 配置Nginx——在线生成配置文件
  10. C#使用RabbitMQ(转)