yolov4论文解析
由于yolov3作者退出yolo算法更新,但并没有停止对yolo的改进。2020年yolov4发出,并得到原作者的肯定。yolov4论文中做了非常多的消融实验进行对比,使用很多的训练策略,在精度上面对比yolov3有比较大的提升。
论文下载地址:https://arxiv.org/pdf/2004.10934
论文代码地址:https://github.com/AlexeyAB/darknet
1、简介
首先来看一下yolov4在coco数据集上的AP值,保证了速度的同时,提到了进度。对比yolov3提升了接近10%的AP值,可以看出yolov4的效果是非常的不错,而对比efficientDet虽然精度低,但是在速度上远超过它,能够达到实时检测的效果。
yolov4是做了哪些改进,使得它的效果提升这么明显,同样,我们先从网络架构、训练策略、数据处理方面进行分析。首先网络架构上,backbone使用CSPDarknet53,neck部分使用PAN特征融合,head和yolov3类似,采用一个1x1卷积输出。训练策略上使用BoF和BoS,BoF就是不增加网络本身的成本进行改进,也就是数据增强,BoS就是改变网络架构,向网络中加入一些模块从而提高网络能力。
2、网络架构
2.1backbone:
为什么要使用CSPDarknet53,作者做了实验,其中CSPDarknet53在检测上面有优势,也就是特征提取能力强,同时它的感受野大,参数量大对模型的学习能力强。
同时,在CSPDarknet53添加了SPP模块,为了进一步的扩大网络的感受野,降低信息丢失。
2.2neck和head:
在neck部分没有使用yolov3中的FPN而是采用PANet作为参数聚合的方式,其中a为FPN,a和b加起来就是PAN,对比FPN多加了一轮下采样。而head和yolov3一样
但是在yolov4的PAN中使用的是concat,而不是add
从上面两个部分构成了yolov4的网络结构
3、训练策略
2.1、BoF和BoS
激活函数使用Mish,IOU Loss使用CIoU,数据增强使用Mosaic、正则化使用DropBlock、归一化采用CmBN、标签平滑处理等。这一系列的改进策略,
作者通过以上的实验来进一步证明所使用的策略的有效性。yolov4当中主要是提出相关的策略,并基于yolov3的基础进行改进。
推荐大家看一下这位大佬的博客详解:
YOLOv4网络详解_太阳花的小绿豆的博客-CSDN博客_yolov4网络结构图
yolov4论文解析相关推荐
- 地图构建两篇顶级论文解析
地图构建两篇顶级论文解析 一.基于声纳的密集水下场景重建 标题:Dense, Sonar-based Reconstruction of Underwater Scenes 作者:Pedro V. T ...
- 传感器标定两篇顶会论文解析
传感器标定两篇顶会论文解析 一.在城市环境中的多个3D激光雷达的自动校准 标题:Automatic Calibration of Multiple 3D LiDARs in Urban Environ ...
- 机器人导航两篇顶级会议论文解析
机器人导航两篇顶级会议论文解析 一.一种用于四旋翼无人机室内自主导航的卷积神经网络特征检测算法 标题:A Convolutional Neural Network Feature Detection ...
- SLAM架构的两篇顶会论文解析
SLAM架构的两篇顶会论文解析 一.基于superpoint的词袋和图验证的鲁棒闭环检测 标题:Robust Loop Closure Detection Based on Bag of SuperP ...
- 将视频插入视频:CVPR2019论文解析
将视频插入视频:CVPR2019论文解析 Inserting Videos into Videos 论文链接: http://openaccess.thecvf.com/content_CVPR_20 ...
- 全景分割:CVPR2019论文解析
全景分割:CVPR2019论文解析 Panoptic Segmentation 论文链接: http://openaccess.thecvf.com/content_CVPR_2019/papers/ ...
- 结构感知图像修复:ICCV2019论文解析
结构感知图像修复:ICCV2019论文解析 StructureFlow: Image Inpainting via Structure-aware Appearance Flow 论文链接: http ...
- 面部表情视频中进行远程心率测量:ICCV2019论文解析
面部表情视频中进行远程心率测量:ICCV2019论文解析 Remote Heart Rate Measurement from Highly Compressed Facial Videos: an ...
- 人脸标记检测:ICCV2019论文解析
人脸标记检测:ICCV2019论文解析 Learning Robust Facial Landmark Detection via Hierarchical Structured Ensemble 论 ...
最新文章
- 杨剑勇:物联网是一个未来概念?其实就在身边
- 实验18:使用@Autowired注解实现根据类型实现自动装配★
- 解决方案:用户 'sa' 登录失败。原因: 未与信任 SQL Server 连接相关联。
- 智能型住宅自动控制与管理系统分析
- python 删除csv第一行_python 标准库学习之 csv
- @Inner使用及原理
- 3.7.3 - Basic String Operations
- css网页favicon_自用代码css获取任意网址的/favicon.ico的方法教程
- 申请以及集成 Stripe 的 Alipay 支付方案
- oracle中decode函数,行转列
- 那些你不可错过的Java博客
- IDEA破解图文教程
- python外汇兑换代码_Python爬取中国银行外汇牌价
- VM虚拟机 - Docker - CentOS 7 - 快速使用Docker从零搭建Hadoop完全分布式集群详细教程(亲测有效,※吐血推荐※)(内含快速启动容器脚本)
- 什么是真正的蒸汽朋克?
- tring转换成Integer numberformatexception 分析
- 基于 Matlab的录屏软件
- 和菜鸟一起学算法之三分法求极值问题
- R统计-微生物群落结构差异分析及结果解读
- 使用阿里云ECS绑定弹性公网IP搭建反向代理服务器