介绍

如果你已读过之前Yolo v1与Yolo v2系列的文章,另外对FPN/RetinaNet等模型也有所了解,那么等你看Yolo v3时就会发现它真的没有啥新货。

简单说Yolo v3是在之前Yolo v2的基础上引入了一些小的改进像positive bounding box的选取,darknet-53中对residual learning思想的引用,类似于FPN的multi-scales feature maps使用等等。但这些小的改动引入之后,新的Yolo v3确实使得最终的mAP值达到了与SSD近似的程度,同时其速度更是要快上3倍。虽然其最优的mAP值与当下火热的RetinaNet网络还有不小差距,但与RetinaNet相比,它在能达到同等程度的mAP值时却能保证有更快的速度。

Yolo_v3与其它模型检测方法在COCO数据集上的性能比较

看明白了吧。Yolo v3延续了Yolo系列模型一贯的特点,那就是mAP值比不过你就跟你较量速度,虽然你丫预测得准,但俺脚步更快。在这么个一切求快的时代,显然速度上佳,甚至能保证实时响应是一个听上去相当有诱惑力也挺唬人的一个东东。

Yolo v3引入的改进

Bounding box预测

以下为Yolo v3中所采用的bounding box坐标的预测,显然其与Yolo v2中采用的并无二致。

bx = σ(tx) + cx

by = σ(ty) + cy

bw = pwet~w~

bh = phet~h~

下图为上述公式的详细解释,同样是原来Yolo v2就已经有过的内容。

Yolo_v3中bounding_box的预测

不过它在判断anchor box的正负时,每个ground truth box只会选用一个与它有最大IOU的anchor box作为正的anchor box,而不再使用一个threshold(一般为0.5),然后将超过此threshold值的anchor box也视为正样本框。这一点是它与SSD或Faster-RCNN系列模型不同的地方。

类预测

Yolo v3使用多目标的方式进行分类,而不再使用softmax,隐含地视所有的bounding boxes只可能属于一类物体。它在最终的loss层中简单地使用逻辑回归来得到每个bounding所属的类别分布,然后再使用cross-entropy来计算training loss。

multi-scales的采用

类似于FPN网络,Yolo v3中采用了相似的思想使用后面三个Conv层的特征来进行预测。在这些层之间也像FPN那样有up-to-down和down-to-up的数据通路。

此外它anchor box dimensions的选取同Yolo v2一样也是通过对训练数据集做k-means聚类得到的。它会将选择出的9个anchor box平均地分布到三个scales的feature maps当中。

在COCO数据集中,聚类得到的9个anchor box scales分别为:(10×13); (16×30); (33×23); (30×61); (62×45); (59×

119); (116 × 90); (156 × 198); (373 × 326)。

darknet-53

Yolo v3中引入了更为强大的特征提取网络darknet-53。它有效借鉴了residual networks中的思想,加上它之前有用过的network in network(或者googlenet)中的使用1×1的conv层在常规3×3 conv层之后作multi feature map channels整合与约减的思想,同时层次与yolo v2中用过的darknet-19也大大加深。最终它能在Imagenet上达到与Resnet-152近似的分类性能(77.2% vs 77.6%),同时比后者拥有更快的计算速度(2x)。

以下两图分别为darknet-53的模型结构与它在分类数据集上和其它模型的性能比较。

Darknet-53

Darknet-53与其它分类网络的性能比较

其它的教训与结论

像RPN等网络那样的预测anchor box的位置偏离等信息会造成模型训练时的震荡。

直接线性地预测x,y的偏离而不是像上文中那样使用logistic action同样被证明是不可取的,会导致几个mAP点的下降。

Focal loss的引入同样会使最终的mAP值下降几个点。分析认为在预测anchor box位置时,objectness的引入即其在最终loss计算时所起的作用表明潜在的过多的negative box不会对classification loss分支产生较大影响。

双重IOU计算标准的引入造成模型精度不一表明当下multi-scales的引入使得Yolo v3可以较好地预测出小scale的目标但却在大scale的目标上产生了不少的错误。

代码分析

以下为Yolo v3的前端输入及整个模型训练超参数。

[net]

# Testing

batch=1

subdivisions=1

# Training

# batch=64

# subdivisions=16

width=416

height=416

channels=3

momentum=0.9

decay=0.0005

angle=0

saturation = 1.5

exposure = 1.5

hue=.1

learning_rate=0.001

burn_in=1000

max_batches = 500200

policy=steps

steps=400000,450000

scales=.1,.1

以下为yolo v3中scales/conv feature maps层/anchor boxes数目/正负threshold判别等的选取。

[yolo]

mask = 6,7,8

anchors = 10,13, 16,30, 33,23, 30,61, 62,45, 59,119, 116,90, 156,198, 373,326

classes=80

num=9

jitter=.3

ignore_thresh = .7

truth_thresh = 1

random=1

新引入的up-to-down的通路。借鉴了FPN中的思想。

[route]

layers = -4

[convolutional]

batch_normalize=1

filters=256

size=1

stride=1

pad=1

activation=leaky

[upsample]

stride=2

[route]

layers = -1, 61

参考文献

YOLOv3: An Incremental Improvement, Joseph-Redmon, 2018

yolo系列外文翻译_Yolo系列其三:Yolo_v3相关推荐

  1. yolo系列外文翻译_Yolo系列其二:Yolo_v2

    介绍 相信SSD的横空出世委实给了Yolo许多压力.在目标检测准确性上Yolo本来就弱于Faster-RCNN,它的提出之初就主打其能保持一定检测准确性的同时实现更快乃至实时的速度.可同一年SSD的出 ...

  2. matlab仿真的英文文献,matlab 外文翻译 外文文献 英文文献 MATALAB 混合仿真平台控制算法的概述...

    matlab 外文翻译 外文文献 英文文献 MATALAB 混合仿真平台控制算法的概述 MATALAB 混合仿真平台控制算法的概述 MATALB 混合仿真平台,即为将硬件引入到仿真回路里的半实物仿真系 ...

  3. 【外文翻译】图像中的傅里叶变换

    转载自:[外文翻译]图像中的傅里叶变换 写在前面:这是我在外网看到的一篇较为易懂.详细的介绍了图像中的傅里叶变换的一篇文章,翻译过来给大家分享一下.适读人群为对机器视觉感兴趣的初学者.为了可读性,没有 ...

  4. 开题报告、文献综述、外文翻译、论文反抄袭软件、论文目录,就差论文正文了,其他都全了!!

    开题报告.文献综述.外文翻译.论文反抄袭软件.论文目录,就差论文正文了,其他都全了!! 开题报告主要包括以下几个方面: (一)论文名称 论文名称就是课题的名字 第一,名称要准确.规范.准确就是论文的名 ...

  5. 开题报告、文献检索账号、文献综述、外文翻译、抄袭检测软件、论文目录,都在这了都在这了,有备无患,拿去吧!

    开题报告.文献综述.外文翻译.论文反抄袭软件.论文目录,就差论文正文了,其他都全了!! 开题报告主要包括以下几个方面: (一)论文名称 论文名称就是课题的名字 第一,名称要准确.规范.准确就是论文的名 ...

  6. 开题报告、文献检索账号、文献综述、外文翻译、抄袭检测软件、论文目录,免费分享,都在这了

    开题报告.文献综述.外文翻译.论文反抄袭软件.论文目录,就差论文正文了,其他都全了!! 反论文抄袭检查,吼吼,终于找到了 来源:http://likelibrary.blog.163.com/blog ...

  7. matlab中的routte,matlab外文翻译外文文献英文文献MATALAB混合仿真平台控制算法的概述...

    <matlab外文翻译外文文献英文文献MATALAB混合仿真平台控制算法的概述>由会员分享,可在线阅读,更多相关<matlab外文翻译外文文献英文文献MATALAB混合仿真平台控制算 ...

  8. 大学计算机专业全英文论文,5计算机专业 外文文献 英文文献 外文翻译 jsp应用框架 中英对照 大学学位论文.doc...

    5计算机专业 外文文献 英文文献 外文翻译 jsp应用框架 中英对照 大学学位论文 外文JSP application frameworks brian wright.michael freedman ...

  9. 微型计算机系统外文,微型计算机控系统(单片机控制系统) 毕业论文外文翻译.doc...

    微型计算机控系统(单片机控制系统) 毕业论文外文翻译 英语翻译 Microcontroller reset is to make the CPU and other system features a ...

最新文章

  1. 使用Ubuntu18.04系统做操作系统实验的步骤
  2. c++多元线性回归_五种优化算法实现多元线性回归
  3. can通道采样频率_CAN总线基础(上)
  4. nfs漏洞修复(showmount -e)
  5. 47K Star 的SpringBoot+MyBatis+docker电商项目,附带超详细的文档!
  6. py---------面向对象进阶
  7. OSI模型 TCP/IP模型 数据包结构
  8. selenium之输出html测试报告
  9. 2019-03-22-算法-进化(回文链表)
  10. (十八)深入浅出TCPIP之HTTP和HTTPS
  11. 突然!锤子科技天猫官方旗舰店商品全线下架 店铺撤店?!
  12. .net 把一个对象赋值给一个参数_一个可以提升JVM运行性能的参数
  13. java增强型for报错_Java自学-数组 增强型for循环
  14. 【运动学】基于matlab斜抛物体斜坡射程【含Matlab源码 980期】
  15. python求偏度系数_python pandas库和stats库计算偏度和峰度(附程序)
  16. 【考试经验】脱离GRE苦海,30天逆袭贴
  17. JavaScript模板引擎
  18. 安卓原生镜像(中国网站)
  19. 【C语言】数组排序法(升序)
  20. kazoo在多进程下使用全局连接死锁问题

热门文章

  1. python log日志_Python的log日志功能及设置方法
  2. fiddler修改支付金额_支付漏洞总结
  3. java的值排序总结
  4. Java之AOP解释
  5. 计算机科学与技术导论%1计算机网络,汕头大学计算机专业课程计划
  6. twitter数据集_推特宠物数据整理及分析
  7. 计算机学院科研,科研概况
  8. 避免Unity变量初始化错误的8条建议
  9. centos+gitlab+mysql_centos7安装配置gitlab(使用外部nginx)
  10. 6远程桌面连接不上_windows server2008 远程桌面 创建新用户和多用户登录