目标检测通用trick

1. 数据增强

离线增强 : 直接对数据集进行处理,数据的数目会变成增强因子 x 原数据集的数目 ,这种方法常常用于数据集很小的时候

在线增强 : 这种增强的方法用于,获得 batch 数据之后,然后对这个 batch 的数据进行增强,如旋转、平移、翻折等相应的变化,由于有些数据集不能接受线性级别的增长,这种方法长用于大的数据集,很多机器学习框架已经支持了这种数据增强方式,并且可以使用 GPU 优化计算。

1.1 在线增强常用

  • 空间几何变换:翻转(水平和垂直)、随机裁剪、旋转、放射变换、视觉变换(四点透视变换)、分段放射

  • 像素颜色变换类:CoarseDropoutSimplexNoiseAlphaFrequencyNoiseAlphaElasticTransformation

  • HSV对比度变换

  • RGB颜色扰动

  • 随机擦除

  • 超像素法

  • 转化法

  • 边界检测

  • Grayscale

  • 锐化与浮雕:如视频中常用

2. 训练策略

2.1 warmup:

训练初期由于离目标较远,一般需要选择大的学习率,但是使用过大的学习率容易导致不稳定性。所以可以做一个学习率热身阶段,在开始的时候先使用一个较小的学习率,然后当训练过程稳定的时候再把学习率调回去。e.d., YOLO v5, effcientDet, … \dots …

2.2学习率衰减策略:

  • 1.指数衰减
  • 2.固定步长衰减
  • 3.多步长衰减
  • 4.余弦退火衰减

2.3 Label smoothing:

one-hot 带来的问题:(容易过度自信,导致过拟合)

对于损失函数,我们需要用预测概率去拟合真实概率,而拟合one-hot 的真实概率函数会带来两个问题:

1)无法保证模型的泛化能力,容易造成过拟合;

  1. 全概率和0概率鼓励所属类别和其他类别之间的差距尽可能加大,而 由梯度有界可知,这种情况很难adapt。会造成模型过于相信预测的类 别。

Label smoothing 增加了模型的泛化能力,一定程度上防止过拟合。

做法:标签中不再只有 0 , 1 0,1 0,1,可以是0.6,0.99,之类

2.4 K-Fold交叉验证

模型选择,模型选择超参

测试方式

  • 1.将所有训练的KFold进行融合

  • 2.最优模型重新训练全部数据后预测

3. 推断策略

3.1NMS(非极大值抑制)

同一个物体可能有好几个框,我们的目标是一个物体只须保留一个最优的框:于是我们就要用到非极大值抑制,来抑制那些冗余的框: 抑制的过程是一个迭代-遍历-消除的过程。

3.2 soft NMS

不要粗鲁地删除所有IOU大于阈值的框,而是降低其置信度

3.3 DIoUNMS

在nms过程中采用DIoU的计算方式替换了IoU,由于DIoU的计算考虑到了两框中心点位置的信息,故使用DIoU进行评判的nms效果更符合实际,效果更优。

3.3 DIoUNMS

在nms过程中采用DIoU的计算方式替换了IoU,由于DIoU的计算考虑到了两框中心点位置的信息,故使用DIoU进行评判的nms效果更符合实际,效果更优。

目标检测通用trick相关推荐

  1. 目标检测训练trick超级大礼包—不改模型提升精度,值得拥有

    点击我爱计算机视觉标星,更快获取CVML新技术 昨日新上arXiv的一篇论文<Bag of Freebies for Training Object Detection Neural Netwo ...

  2. 深度学习目标检测之 YOLO v4

    论文原文:https://arxiv.org/abs/2004.10934 代码 原版c++: https://github.com/AlexeyAB/darknet keras:https://gi ...

  3. 【我的第一个目标检测课题】3、Retinanet网络的学习与实现+扩展

    2021.1.7下午记 大家新年好~ 距离上次写这个课题的博客已经是去年12.30的时候了,是想趁热打铁赶快写的,无奈1.5/1.6有两门考试,便只好赶去复习暂时搁置了.现在终于考完试,而且也马上到了 ...

  4. 2022目标检测综述

    目录 0.引言 1.背景 1.1.问题描述 1.2.目标检测的核心问题 1.3.目标检测中的关键挑战 2.关于损失函数 3.关于IOU 4.数据集以及评价指标 4.1.评价指标 4.2.数据集 5.目 ...

  5. YOLO系列详解 目标检测

    yolo v1 前言 相比同年的fast-rcnn和ssd都没有优势 详解 B=2,Pr(Object)为0或者1 在v1中没有anchor的概念,预测的xywh是直接预测的box的位置,不像fast ...

  6. Hinton团队CV新作:用语言建模做目标检测,性能媲美DETR

    点击上方"视学算法",选择加"星标"或"置顶" 重磅干货,第一时间送达 来自|arxiv  编译|机器之心 目标检测的「尽头」是语言建模?近 ...

  7. 图灵奖大佬Hinton团队CV新作:用语言建模做目标检测,性能媲美DETR

    来源:机器之心 目标检测的「尽头」是语言建模?近日,Hinton 团队提出了全新目标检测通用框架 Pix2Seq,将目标检测视作基于像素的语言建模任务,实现了媲美 Faster R-CNN 和 DET ...

  8. Keras搭建YoloV4目标检测平台

    学习前言 什么是YOLOV4 代码下载 YOLOV4改进的部分(不完全) YOLOV4结构解析 1.主干特征提取网络Backbone 2.特征金字塔 3.YoloHead利用获得到的特征进行预测 4. ...

  9. 一文了解YOLO-v4目标检测

    一.YOLO-v4主要做了什么? 通俗的讲,就是说这个YOLO-v4算法是在原有YOLO目标检测架构的基础上,采用了近些年CNN领域中最优秀的优化策略,从数据处理.主干网络.网络训练.激活函数.损失函 ...

最新文章

  1. ​“后进生”数学学科上演完美逆袭,成最具竞争力专业之一
  2. 中文NER任务简析与深度算法模型总结和实战展示 转 作者原创的不错,很有水平,需要研读
  3. [原创] 腾讯RTX二次开发相关的一些注意事项
  4. 递归方法:对于树形结构的表,根据当前数据获取无限极的父级名称
  5. 安卓开发必备知识体系:安卓篇
  6. 每天研究一个产品,阿德老师“手摸手”带你写产品分析报告 |
  7. java web 页面提速
  8. intellij中重命名一个文件
  9. Java开发必看JPA概念大全
  10. Cuda:invalid device pointer
  11. Win10使用sh执行python脚本报错:Permission denied
  12. 《软件质量保证与测试》读书笔记(一)
  13. centos 6.8 安装mysql
  14. c# directory.getfiles按照文件名称
  15. 加油站会员管理系统用什么好
  16. [转]通过研究视线轨迹改良设计
  17. 树莓派科学小实验4B--07_继电器
  18. 人民币贬值不是大问题
  19. 网上看到的window8下载
  20. 面向对象的银行ATM系统分析

热门文章

  1. TCP/IP 开胃菜 之 HTTP
  2. 免费全国车辆违章查询API接口及其使用方法
  3. 电脑如何查找重复文件?轻松揪出它!
  4. LVS负载均衡群集——DR直接路由模式
  5. 我的世界服务器无限漏斗,我的世界漏斗刷物品攻略,掌握2处bug东西任你刷
  6. 使用transfrom来制作旋转木马
  7. 计算机核心期刊新排名!
  8. 程序员一般用什么免费数据库管理工具?
  9. 不知不觉已经大四了,错过了秋招,春招是该好好把握了
  10. 家庭版win7怎么把计算机,不重装电脑系统,怎么让Win7家庭版变成旗舰版