导读

旷视团队对YOLO系列的再一次超越。

论文链接:https://arxiv.org/abs/2107.08430

1. YOLOX

1.1 YOLOX-DarkNet53

YOLOv3 baseline  以Darknet53作为Baseline,给大家介绍如何一步一步过渡到现在的YOLOX-DarkNet53。YOLOv3是以Darknet53为主干,后面再加上SPP。我们对训练策略进行了一些修改,增加了EMA weights updating,余弦学习率,IoU损失,以及IoU-aware分支,在训练分类和objectness的分支中,我们使用了BCE loss。在数据增强方面,我们只使用了水平翻转,颜色抖动和多尺度。

Decoupled head  在目标检测中,分类和回归的任务是有相互冲突的,这是个普遍认可的问题。因此,一般会将分类和回归分开2个分支,但是在YOLO系列中,仍然是没有分开的。这里,我们将耦合的检测头分开,变为2个相互独立的检测分支。具体如下图:

Strong data augmentation  在数据增强中,我们使用了Mosaic和Mix up的增强策略,使用了这些增强策略之后,我发现预训练模型已经没有必要了,因此后面所有的训练都是从头训练的。

Anchor-free  将YOLO转换为anchor free其实很简单,我们将每个空间位置的输出由3减少到1,直接输出4个值,即左上角点的两个偏差值,以及宽和高。对于每个目标,其中心点位置所在的区域即为正样本,并预先定义一个尺度范围,将每个目标分配到不同的FPN层上。

Multi positives  上面提到的anchor free的正样本选择策略,对于每个目标只选择了1个正样本,这样会忽略掉其他的高质量的预测,使用这些高质量的预测对于梯度是有好处的,而且样本的不均衡性也会减少一些。这里,我们简单的使用了中心点3x3的区域,都作为正样本。

SimOTA 对于标签的分配,我们总结了4个关键点:1)损失/质量相关性 2)中心优先 3)每个GT的正样本anchor点的动态数量 4)全局视角。我们使用OTA作为候选的标签匹配策略。然后对OTA进行了修改,提出了SimOTA。首先,计算每个prediction-gt对的匹配度,用损失和质量来表示,这里,在SimOTA中,使用损失来表示:

其中,λ是平衡系数,然后,对于一个gt,用gi来表示,我们选择在一个固定的中心区域内,topk个具有最小的cost的预测来作为正样本,最后,这些正样本所在的grid也被分配为正样本,其他的grid是负样本,注意,对于不同的gt,k是不一样的。

End-to-end YOLO  我们增加了2个额外的卷积层,进行一对一的标签分配,不需要梯度。这使得检测器可以端到端的运行,这个略微降低了性能和速度。所以作为可选项。

具体的各种修改的效果如下:

1.2 其他的backbone

我们还测试了其他的主干。

Modified CSPNet in YOLOv5

Tiny and Nano detectors

Model size and data augmentation

2. 和其他的SOTA的对比

—END—

论文链接:https://arxiv.org/abs/2107.08430


往期精彩回顾适合初学者入门人工智能的路线及资料下载机器学习及深度学习笔记等资料打印机器学习在线手册深度学习笔记专辑《统计学习方法》的代码复现专辑
AI基础下载机器学习的数学基础专辑温州大学《机器学习课程》视频
本站qq群851320808,加入微信群请扫码:

【论文解读】​YOLOX: Exceeding YOLO Series in 2021相关推荐

  1. 【论文阅读】YOLO-X:Exceeding YOLO Series in 2021

    题目: YOLOX: Exceeding YOLO Series in 2021 作者: Zheng Ge Songtao Liu Feng Wang Zeming Li Jian Sun motiv ...

  2. YOLOX: Exceeding YOLO Series in 2021 --- Study Notes

    1 介绍 YOLOX是目前 Paper and Codes – Real-Time Detection Models排名第一的模型,boxAP = 51.2: 论文链接:YOLOX: Exceedin ...

  3. 《YOLOX: Exceeding YOLO Series in 2021》阅读

    文章下载: YOLOX-Exceeding YOLO Series in 2021.pdf 摘要 本篇文章中,我们展示了在 YOLO 系列检测器上的改进,并获得了一个高性能的目标检测器 -- YOLO ...

  4. Anchor-Free系列之YOLOX:Exceeding YOLO Series in 2021

    Yolo系列目标检测算法知识点总结_程大海的博客-CSDN博客_yolo系列目标检测算法 Anchor-Free系列之CenterNet:Objects as Points_程大海的博客-CSDN博客 ...

  5. 【目标检测】YOLOX ,YOLO系列的集大成者

    文章目录 一.YOLOX简介 二.YOLOX模型结构(Decouple head) 三.YOLOX的改进之处 3.1 数据增强(data augmentation) 3.2 Anchor-free(不 ...

  6. 【论文解读】ICLR 2021 |可信多模态机器学习:兼听则明,信而有征

    论文解读:韩宗博 硕士研究生 | 天津大学 智能与计算学部 指导老师:张长青,天津大学副教授,博士生导师 1. 方法动机 多模态人工智能技术正在被广泛应用到智能医疗.无人系统等重要领域,设计精准.可靠 ...

  7. 2021 CVPR论文解读征集令

    2021年,旷视研究院迎来了崭新的征程,在CVPR论文中,一共有22篇成功入选,其中口头报告2篇.被收录的论文涵盖了激活函数.神经网络.神经网络架构搜索.光流估计.无监督学习.人体姿态估计.目标检测等 ...

  8. CVPR 2021 | 腾讯AI Lab入选论文解读

    本文转载自腾讯AI实验室 CVPR(Conference on Computer Vision and Pattern Recognition)是计算机视觉三大顶会之一,也是中国计算机学会推荐的人工智 ...

  9. fasterrcnn论文_【论文解读】Yolo三部曲解读——Yolov1

    打个广告,复现Yolov3之后的深度原理剖析请移步下文(含代码): [算法实验]能检测COCO并鉴黄的SexyYolo(含Yolov3的深度原理剖析) Yolov1论文链接:You Only Look ...

最新文章

  1. 我是如何把微服务的这个模式落地的:一个服务一个数据库模式(中)
  2. mongoDB删除某个字段(key)
  3. 火爆背后的挑战:直播平台的高并发架构设计
  4. E - Olympic Medal CodeForces - 215B(数学 思维)
  5. Slip.js – 在触摸屏上实现 Swipe 对列表重新排序
  6. VMware vCloud® Suite 5.5功能介绍
  7. Spring Boot笔记-mysql5.7使用@Table后提示doesn't exist问题
  8. React as a UI Runtime(五、列表)
  9. codeforces 360B
  10. sweetalert
  11. luarocks安装以及lfs安装
  12. 微支付开发(.net)
  13. 1.静态方法只能访问静态成员(包括变量和方法不能直接访问实例成员,除非使用对象调用2.实例方法既可以访问静态成员,也可以访问实例成员
  14. python+turtle制作一个生日蛋糕
  15. ICDsoft主机半价优惠码推荐
  16. 终于进了腾讯,记录一下我作为一名测试员磕磕碰碰的三个月找工作经历...
  17. 2021前端面试总结及反思
  18. 快70倍!新一代JS构建工具:ESBuild SWC浅析
  19. 计算机网络——Packet Trace路由器配置——课程设计
  20. 中国智能行车记录仪行业发展现状及趋势分析,DMS将替代DVR

热门文章

  1. windows下自制动画层引擎 - 放两个demo
  2. javascript 浮点数加减乘除计算会有问题, 整理了以下代码来规避这个问题
  3. view bitmap 截图
  4. 浮点数在计算机中是如何表示的
  5. 前端下载二进制流文件
  6. myeclipse中配置spring xml自己主动提示
  7. nginx 中location中root和alias的区别
  8. 【面向对象】类的特殊成员方法
  9. 最大化平均值 (二分搜索法)
  10. return 和 exit