YoloV4论文学习
一、引言
贡献有三点:
- 开发了一个高效、强大的目标检测模型,可以让任何人仅仅通过1080TI或2080TI训练一个快速且检测准确的检测器。
- 通过大量的训练实验验证Bag of Freebies和Bag of Specials对检测的影响。
- 改进CBN、PAN、SAM等等方法,使之更适合单GPU训练。
yolov4跟其他算法的对比图:
二、相关工作
2.1 目标检测模型
深度学习的目标检测器一般包含两个部分。第一,骨干网络(backbone);第二,检测头(head)。目前常见运行在GPU的骨干网络有VGG,ResNet,ResNeXt和DenseNet;运行在CPU的骨干网络有SqueezeNet,MobileNet和ShufflfleNet。
检测头通常分为两类:一步式检测器( one-stage object detector);二步式检测器(two-stage object detector)。典型的一步式检测器有R-CNN系列,RepPoints(也属于anchor-free);典型的二步式检测器有Yolo系列,SDD,RetinaNet。近年来anchor-free one-stage也发展起来了,比如CenterNet,CornerNet,FCOS等等。
近年来发展起来的对象检测器通常在主干和头部之间插入一些层,这些层通常用于收集不同阶段的特征图。 我们可以称之为物体探测器的颈部(neck)。
如下如图总结所示:
2.2 Bag of freebie
字面意思是“免费赠品”。论文里是这样解释的:训练一般是离线的,我们可以在训练阶段采用一些方法,在推理阶段不增加任何消耗以提高检测的准确性。符合这种的特性的方法常见的就是数据增强(data augmentation),数据增强的中常用的两种方法是brightness, contrast, hue, saturation, 和noise等在内的光度畸变(photometric distortions)和random scaling, cropping, flflipping, and rotating等在内的几何畸变(geometric distortions )。当然也有其他方法,比如random erase 、CutOut等等。
另一个符合Bag of freebie的特性的方法就是Bounding Box (BBox) regression。最开始使用的是Mean Square Error (MSE),随后出现IoU loss(解决传统方法计算{x,y,w,h}的L1或L2损失时,损失会随着尺度的增加而增加的问题),改进版GIoU loss,再改进版本DIoU loss,最后的完整版本CIoU loss。
2.3 Bag of specials
字面意思是“特价赠品”。论文里是这样的解释的:对于某些插件模块或后处理方法,仅仅增加微小消耗但检测效果却显著提升。一般来说,插件模块是为了增强模型中的某些属性,如扩大感受野、引入注意机制或强化特征集成能力;后处理方法是筛选模型预测结果的。
强化感受野的有,SPP, ASPP ,和RFB。在物体检测中经常使用的注意模块主要分为通道注意和点注意,这两种注意模型的代表是Squeeze-and-Excitation (SE,更适合用于移动设备)和Spatial Attention Module(SAM)。强化特征集成能力有FPN,SFAM,ASFF和BiFPN。
后处理方法一般只NMS,NMS的发展过程有:NMS、soft NMS(考虑遮挡导致置信度低的问题)、DIoU NMS(在soft NMS基础上,考虑中心距离)。
三. 理论
论文提供两种实时神经网络:第一种,对于GPU采用少量(大概1到8组)神经网络“群组”构成的网络,比如,CSPResNeXt50 / CSPDarknet53 ;第二种,对于VPU采用grouped-convolution,但是不采用上述提到的SE模块,比如,EffificientNet-lite / MixNet/ GhostNe/ MobileNetV3。
YoloV4论文学习相关推荐
- YOLO-V4 论文学习+唐宇迪博士课程学习笔记
论文主要贡献: 1.利用单GPU即可训练一个目标检测器. 2.验证了Bag-of-Freebies 和 Bag-of-Specials方法在训练目标检测器当中的作用. 3.对包括CBN.PAN.SAM ...
- YOLOv4论文阅读(附原文翻译)
YOLOv4论文阅读(附原文翻译) 论文阅读 论文翻译 Abstract摘要 1.Introduction 引言 2.Related work相关工作 2.1.Object detection mod ...
- YOLOv4论文阅读笔记(一)
YOLOv4论文阅读笔记 Introduction Related work Bag of freebies Bag of Specials 近日发表的YOLOv4无疑是2020年目前最轰动的重磅炸弹 ...
- 动态环境下的SLAM:DynaSLAM 论文学习笔记
动态环境下的SLAM:DynaSLAM 论文学习笔记 这篇文章 论文摘要 系统流程 相关环节的实现方法 神经网络检测图中动态物体(Mask R-CNN) Low-Cost Tracking 使用多视图 ...
- yolov4论文_Alexey 大神接棒,YOLOv4 重磅来袭!快来一睹论文真容吧!| 原力计划...
作者 | Mr.Jk.Zhang 责编 | 夕颜 出品 | CSDN(ID:CSDNnews) 前言 千呼万唤始出来系列,继YOLOv3两年后,YOLOv4终于在上周出来了,让我们来一睹论文真容吧!由 ...
- 单目相机 svd 从图像恢复3维位置_论文学习——VINSMono:一种鲁棒且通用的单目视觉惯性系统...
点击上方"视觉部落",选择"星标"公众号 精选作品,第一时间送达 文章同步首发于知乎用户yikang专栏 Part 1. 基本信息 本文提出了一种基于紧耦合滑动 ...
- 识别和追踪主题层次的影响力者(来自2018 Machine Learning 论文学习笔记)
本文作者:合肥工业大学 管理学院 钱洋 email:1563178220@qq.com . 以下内容是个人的论文阅读笔记,内容可能有不到之处,欢迎交流. 未经本人允许禁止转载. 文章目录 论文来源 论 ...
- High Performance Visual Tracking with Siamese Region Proposal Network 论文学习
文章目录 论文阅读总结 Translation Abstract 1 Introduction 2 Related Works 2.1 Trackers based on Siamese networ ...
- [论文学习]TDN: An Integrated Representation Learning Model of Knowledge Graphs
[论文学习以及翻译]TDN: An Integrated Representation Learning Model of Knowledge Graphs 文章主要内容 摘要 前言 相关工作 基于T ...
最新文章
- 神经网络侧枝抑制(自编码)
- Spring @Conditional
- SAP Spartacus pageSlot一览
- leetcode 399. 除法求值(bfs)
- Modelsim-Altera仿真设置
- Basic Level 1006. 换个格式输出整数 (15)
- Tomcat 6、7在EL表达式解析时存在的一个Bug
- linux从一台服务器传输文件到另一台服务器上
- VARCHART XGantt 甘特图如何创建和修改数据记录
- 批处理删除指定文件夹中的指定类型文件
- Tourist Behaviour Themes and Conceptual Schemes--Chapter 1 Studying Tourist Behaviour
- 代码review神器Upsource,让你快乐的进行CodeReview
- JAVA医院预约挂号系统毕业设计 开题报告
- 怎么把word里面的彩色图转化为灰度图,直接在word里面操作,无需转其他软件,超简单!(位图和矢量图都可以)
- python 抽奖 完全公平的随机数算法_抽奖 随机数
- 逻辑回顾_回顾色彩设计
- 计算机设置共享文件,电脑设置共享文件夹的方法步骤
- Candy Crush Soda 赏析
- 计算机系统结构第二版习题答案,计算机系统结构课后习题答案(第2版).docx
- centos挂载和取消挂载
热门文章
- 国产Linux系统再添一员猛将,颜值完全不输苹果!
- 全球变化生态学尔雅课答案
- 对应分析图解读的七种方法
- 边做边爱(1)——mapbox做分析图
- CentOS 6.5安装Nvidia显卡驱动
- java 向量存储_关于java:使用AES-256和初始化向量进行加密
- 归一化函数normalize
- 怎么将计算机恢复到前一天的状况,excel表格恢复前一天数据-我想将excel表格中的两组数据做对比(数据是每天变......
- 解决Microsoft Visual Studio 2010 Macro宏无法运行
- 智能家居系统中网关与服务器如何连接?