本文好多内容转载自
https://blog.csdn.net/leviopku/article/details/82660381

yolo_v3 提供替换backbone。要想性能牛叉,backbone可以用Darknet-53,要想轻量高速,可以用tiny-darknet

首先,看一下YOLOV3网络结构

DBL: 如图1左下角所示,也就是代码中的Darknetconv2d_BN_Leaky,是yolo_v3的基本组件。就是卷积+BN+Leaky relu。对于v3来说,BN和leaky relu已经是和卷积层不可分离的部分了(最后一层卷积除外),共同构成了最小组件。

resn:n代表数字,有res1,res2, … ,res8等等,表示这个res_block里含有多少个res_unit。这是yolo_v3的大组件,yolo_v3开始借鉴了ResNet的残差结构,使用这种结构可以让网络结构更深(从v2的darknet-19上升到v3的darknet-53,前者没有残差结构)。对于res_block的解释,可以在图1的右下角直观看到,其基本组件也是DBL。

concat:张量拼接。将darknet中间层和后面的某一层的上采样进行拼接。拼接的操作和残差层add的操作是不一样的,拼接会扩充张量的维度,而add只是直接相加不会导致张量维度的改变。

layers数量一共有252层,包括add层23层(主要用于res_block的构成,每个res_unit需要一个add层,一共有1+2+8+8+4=23层)。除此之外,BN层和LeakyReLU层数量完全一样(72层),在网络结构中的表现为:每一层BN后面都会接一层LeakyReLU。卷积层一共有75层,其中有72层后面都会接BN+LeakyReLU的组合构成基本组件DBL。看结构图,可以发现上采样和concat都有2次,和表格分析中对应上。每个res_block都会用上一个零填充,一共有5个res_block

其次,看一下output

对于图1而言,更值得关注的是输出张量:

yolo v3输出了3个不同尺度的feature map,如上图所示的y1, y2, y3。这也是v3论文中提到的为数不多的改进点:predictions across scales
这个借鉴了FPN(feature pyramid networks),采用多尺度来对不同size的目标进行检测,越精细的grid cell就可以检测出越精细的物体。
y1,y2和y3的深度都是255,边长的规律是13:26:52
对于COCO有80个种类,所以每个box应该对每个种类都输出一个概率。
yolo v3设定的是每个网格单元预测3个box,所以每个box需要有(x, y, w, h, confidence)五个基本参数,然后还要有80个类别的概率。所以3*(5 + 80) = 255。这个255就是这么来的。) v3用上采样的方法来实现这种多尺度的feature map,可以结合图1和图2右边来看,图1中concat连接的两个张量是具有一样尺度的(两处拼接分别是26x26尺度拼接和52x52尺度拼接,通过(2, 2)上采样来保证concat拼接的张量尺度相同)。作者并没有像SSD那样直接采用backbone中间层的处理结果作为feature map的输出,而是和后面网络层的上采样结果进行一个拼接之后的处理结果作为feature map。

最后,总结一下

上文把yolo_v3的结构讨论了一下,下文将对yolo v3的若干细节进行剖析。
Bounding Box Prediction
b-box预测手段是v3论文中提到的又一个亮点。先回忆一下v2的b-box预测:想借鉴faster R-CNN RPN中的anchor机制,但不屑于手动设定anchor prior(模板框),于是用维度聚类的方法来确定anchor box prior(模板框),最后发现聚类之后确定的prior在k=5也能够又不错的表现,于是就选用k=5。后来呢,v2又嫌弃anchor机制线性回归的不稳定性(因为回归的offset可以使box偏移到图片的任何地方),所以v2最后选用了自己的方法:直接预测相对位置。预测出b-box中心点相对于网格单元左上角的相对坐标。


YOLO系列:YOLO v3解析相关推荐

  1. 目标检测YOLO系列------YOLO简介

    目标检测YOLO系列------YOLO简介 1.为什么会出现YOLO算法 2.YOLO算法会逐渐成为目标检测的主流吗     YOLO以及各种变体已经广泛应用于目标检测算法所涉及到的方方面面,为了梳 ...

  2. 【目标检测】yolo系列yolo x学习笔记(2021年旷视)

    目录 一.速度和检测效果 二.yoloX的改进点 2.1 Decoupled Head(解耦头) 2.2数据增强:Mosaic + MixUp 2.3 Anchor Free 2.4 Label As ...

  3. yolo系列之yolo v3【深度解析】——讲的挺好,原作者厉害的

    版权申明:转载和引用图片,都必须经过书面同意.获得留言同意即可 本文使用图片多为本人所画,需要高清图片可以留言联系我,先点赞后取图 这篇博文比较推荐的yolo v3代码是qwe的keras版本,复现比 ...

  4. YOLO系列(v1~v3)的学习及YOLO-Fastest在海思平台的部署(中)

    YOLO系列(v1~v3)的学习及YOLO-Fastest在海思平台的部署(上) YOLO系列(v1~v3)的学习及YOLO-Fastest在海思平台的部署(中) YOLO系列(v1~v3)的学习及Y ...

  5. yolo类检测算法解析——yolo v3

    原文:https://www.cnblogs.com/cvtoEyes/p/8608205.html yolo类检测算法解析--yolo v3 计算机视觉的发展史可谓很长了,它的分支很多,而且理论那是 ...

  6. 目标检测 | YOLO系列超全讲解v1,v2,v3

    前言 一.YOLOv1 1. 网络结构 2. 实现方法 3. 损失函数 4. 缺点 二.YOLOv2 1. 网络结构 2. 改进方法 3. YOLO9000 4. 网络训练细节 三.YOLOv3 1. ...

  7. YOLO系列 --- YOLOV7算法(二):YOLO V7算法detect.py代码解析

    YOLO系列 - YOLOV7算法(二):YOLO V7算法detect.py代码解析 parser = argparse.ArgumentParser()parser.add_argument('- ...

  8. YOLO系列 --- YOLOV7算法(四):YOLO V7算法网络结构解析

    YOLO系列 - YOLOV7算法(四):YOLO V7算法网络结构解析 今天来讲讲YOLO V7算法网络结构吧~ 在train.py中大概95行的地方开始创建网络,如下图(YOLO V7下载的时间不 ...

  9. YOLO系列(v1~v3)的学习及YOLO-Fastest在海思平台的部署(上)

    YOLO系列(v1~v3)的学习及YOLO-Fastest在海思平台的部署(上) YOLO系列(v1~v3)的学习及YOLO-Fastest在海思平台的部署(中) YOLO系列(v1~v3)的学习及Y ...

  10. yolo v3制作自己的数据_小白也能弄懂的目标检测之YOLO系列 第一期

    大家好,上期分享了电脑端几个免费无广告且实用的录屏软件,这期想给大家来讲解YOLO这个算法,从零基础学起,并最终学会YOLOV3的Pytorch实现,并学会自己制作数据集进行模型训练,然后用自己训练好 ...

最新文章

  1. 3 个重要因素,带你看透 AI 技术架构方案的可行性
  2. 基于 abp vNext 和 .NET Core 开发博客项目 - 定时任务最佳实战(一)
  3. YBTOJ洛谷P2223:软件开发(费用流)
  4. 【Java】RuleSource约束常用方法整理
  5. storm能不能测试wadl_测试网红燃油宝到底能不能除积碳,看完不花冤枉钱
  6. maven命令-P 参数引发的思考
  7. Unix整理笔记——在指定时间运行程序——里程碑M12
  8. java 绩效考核系统源码_基于jsp的企业绩效考核系统-JavaEE实现企业绩效考核系统 - java项目源码...
  9. 维修变频器和服务器赚钱吗,过来人经验分享:变频器维修杂谈(一)
  10. PTAM + OpenCV3.4.1 + Ubuntu16.04
  11. ArchSummit 北京 2016之lookalike主题
  12. 【工程光学】理想光学系统
  13. 深度学习 图像分割开源代码(附链接,超级全)
  14. matlab相机标定工具箱下载,matlab相机标定工具箱
  15. JAVA技术交流(学习群):51194570;JAVA技术交流(应用群):51194804
  16. QQ传输文件原理参考(来自互联网)
  17. 2018年算法工程师秋招经验贴(微软、华为、网易游戏、阿里offer)
  18. 循序渐进:用python做金融量化分析(五)MACD策略系统
  19. 软件需求工程 高校教学平台 系统维护计划
  20. ORA-01732: 此视图的数据操纵操作非法

热门文章

  1. Layui数据表格分页参数详解
  2. JAVA面试题100道
  3. Objective-C学习资源
  4. 【优化求解】基于遗传算法优化PARSEC 方法的翼型形状附matlab代码
  5. 微信小程序web-view与H5之间交互(含支付)
  6. 什么是Oauth2.0授权,四种授权模式
  7. 医学图像分割 unet实现(一)
  8. IoTGateway 国内开源工业 IoT 物联网网关
  9. 使用PlayCanvas制作一个简单的小游戏(三)
  10. 北京大学计算机学院复试名单2021,北京大学研究生招生简章2021(北京大学研究生复试名单)...