亚运会倒计时！AI目标检测助力亚运陈共举办！

关注并星标

从此不迷路

计算机视觉研究院

公众号ID｜ComputerVisionGzq

学习群｜扫码在主页获取加入方式

计算机视觉研究院专栏

作者：Edison_G

目标检测是现在最热门的研究课题，目前最流行的还是Yolo系列框架，最近我们计算机视觉研究院也分享了很对目标检测干活及实践，都是Yolo-Base框架，今天我们分享一个经过修改后的Yolov5，实时检测的效果！

开源代码：https://github.com/ultralytics/yolov5/releases

前言

目标检测是现在最热门的研究课题，现在的框架越来越多，但是技术的新颖性到了瓶颈，目前开始流行Transformer机制，而且在目标检测领域也能获得较大的提升，也是目前研究的一个热点。

即将举行的亚运会，将会投入更多的先进科技，比如3D成像、姿态估计、目标检测、跟踪及识别！让去全世界看到不一样的中国，不一样的科技，不一样的亚运会。今天我们就说说目标检测会在亚运会中的体现！

目前最流行的还是Yolo系列框架，最近我们“计算机视觉研究院”也分享了很对目标检测干活及实践，都是Yolo-Base框架。

高斯YoloV3目标检测（文中供源码链接）
Yolo轻量级网络，超轻算法在各硬件可实现工业级检测效果（附源代码）
不再只有Yolo，现在轻量级检测网络层出不穷（框架解析及部署实践）
CVPR21目标检测新框架：不再是YOLO，而是只需要一层特征（干货满满，建议收藏）

新框架改进

今天我们分享一个经过简单优化过的Yolov5，暂时命名为：Pad-YoloV5，在IPad上可以实时检测！基于YoloV5框架，熟悉的同学应该都不用多加解释。

YoloV4在YoloV3的基础上增加了近两年的研究成果，如下：

输入端采用mosaic数据增强
Backbone上采用了CSPDarknet53、Mish激活函数、Dropblock等方式。（cspnet减少了计算量的同时可以保证准确率）
Mish函数为：
Neck中采用了SPP、FPN+PAN的结构，
输出端则采用CIOU_Loss、DIOU_nms操作

YoloV5主要的改变，如下：

输入端：Mosaic数据增强、自适应锚框计算
Backbone：Focus结构，CSP结构
Neck：FPN+PAN结构
Prediction：GIOU_Loss

这次主要优化，是YoloV5在数据增强的时候，用随机缩放、随机裁剪、随机排布的方式进行拼接，这个对于小目标的检测效果还是很友好的。通过实验发现，这个随机拼接和有规律的拼接，最终的结果还是有一点差别的。

首先我通过修改数据增强的策略，开始对整体数据集进行统计（也就是数据预处理分析），我大致分成三个范围。将最大的与最小的进行随机拼接，最终结果确实比整体随机的效果好！

其次，稍微修改了下自适应图片缩放策略，Yolov5代码中datasets.py的letterbox函数中进行了修改，对原始图像自适应的添加最少的黑边。我是在自适应缩放后的图片，我在右下角位置填边，其实大多数数据没有什么变化，只是随便改改，因为在线都是在Yolo的基础上增加最近几年新出的策略，确实在最后的检查有一定效果的增加。

最后的修改，就是辛苦的把Transformer机制加进了YoloV5的基础框架中，训练确实加快了，但是对于用笔记本训练的成果物，还是不够明显。这也是最近第一次分享实践过程的一些小心思，具体的细节我们“计算机视觉研究院”后期会通过一篇干活详细和大家分享！

© THE END

转载请联系本公众号获得授权

计算机视觉研究院学习群等你加入！

计算机视觉研究院主要涉及深度学习领域，主要致力于人脸检测、人脸识别，多目标检测、目标跟踪、图像分割等研究方向。研究院接下来会不断分享最新的论文算法新框架，我们这次改革不同点就是，我们要着重”研究“。之后我们会针对相应领域分享实践过程，让大家真正体会摆脱理论的真实场景，培养爱动手编程爱动脑思考的习惯！

扫码关注

计算机视觉研究院

公众号ID｜ComputerVisionGzq

学习群｜扫码在主页获取加入方式

往期推荐

亚运会倒计时！AI目标检测助力亚运陈共举办！相关推荐

极智AI | 目标检测实现分享二：听说克莱今天复出了？详解 YOLOv2 算法与克莱检测
欢迎关注我的公众号 [极智视界],回复001获取Google编程规范 O_o >_< o_O O_o ~_~ o_O 大家好,我是极智视界,本文介绍一下克莱 ...

【AI目标检测】VOC格式数据集转换为DOTA类型数据集
由于目前的imglabel画出来框都是voc类型的xml文件: <annotation><folder>rotate_jueyuanzi_zip</folder>& ...

中科院陈智能：计算机视觉经典——深度学习与目标检测
不到现场,照样看最干货的学术报告! 嗨,大家好.这里是学术报告专栏,读芯术小编不定期挑选并亲自跑会,为大家奉献科技领域最优秀的学术报告,为同学们记录报告干货,并想方设法搞到一手的PPT和现场视频--足 ...

吴恩达《卷积神经网络》精炼笔记（3）-- 目标检测
AI有道不可错过的AI技术公众号关注 1 Object Localization 前两节课程中,我们介绍的是利用CNN模型进行图像分类.除此之外,本周课程将继续深入介绍目标定位和目标检测(包含多目 ...

Coursera吴恩达《卷积神经网络》课程笔记（3）-- 目标检测
红色石头的个人网站:redstonewill.com <Convolutional Neural Networks>是Andrw Ng深度学习专项课程中的第四门课.这门课主要介绍卷积神经网 ...

目标检测Workshop | COCO三连冠带你探索检测新世界
在哲威老师与各位同学畅聊旷视研究院AI计算组的宝藏科技 -RIFE 光流估计算法后我们接着与大家一起探索目标检测的现在和未来这个暑假,跟紧旷妹的脚步缓解你的CV焦虑感,斩获CV幸福感! 本期 ...

综述|基于深度学习的目标检测(一)
码字不易,欢迎给个赞! 欢迎交流与转载,文章会同步发布在公众号:机器学习算法全栈工程师(Jeemy110) 目录目录概述数据集和性能指标数据集性能指标 R-CNN SPP-net Fast ...

基于MMRotate训练自定义数据集做旋转目标检测 2022-3-30
本文目录简述 1.MMrotate下载 2.环境安装 3.自定义数据集制作 3.1 roLabelImg 打标签 3.2 生成DOTA数据集格式的标签 3.3 数据集裁剪(split) 4.修改配置 ...

CVPR2023 目标检测论文合集
国际计算机视觉与模式识别会议(CVPR)是计算机科学领域中的顶级会议之一,也是图像处理.机器学习.人工智能等多个领域的交叉学科会议. 每年的CVPR会议都会有大量的论文投稿和学术交流活动,其中涵盖了包 ...

最新文章

img标签文件不存在_HTML常用标签

【Java】Java中的异常处理：何时抛出异常，何时捕获异常？

23种设计模式之简单工厂

asr语音转写_搜狗智能录音笔C1正式上市语音转文字准确率达95%

OpenGL与gl glu glut freeglut glew glfw封装库关系(十五)

WPS制作甘特图实操(带图超详细)

mybatis根据日期范围查询，多参数查询

为什么程序员做外包会被瞧不起？

庄子《天下》：道与术，取与予，利与害，方与圆，常与变，生与死

【2k行代码优秀课设】基于stm32f4xx粤嵌GEC-M4的按键密码锁、呼吸灯、蜂鸣器音乐、超声波测距及倒车雷达、温湿度检测、光敏电阻自动灯光调节、USART串口控制系统

银行数字化转型导师坚鹏：《银行业同业竞争策略分析》

as3种常见的弹性效果公式以及波形运动等as3动画效果公式代码整理

showdown解析markDown的使用方法

Win10桌面图标显示不正常变成了白色

matlab编写拉格朗日插值代码函数

python随堂检测4

ImageJ 用户手册——第三部分（ImageJ扩展）

cPython的GIL

python: os 库

Ventoy-一种更便捷的OS启动盘制作方法

热门文章

STC8学习 --并口通信

ruby中gruff画图的简单例子

android 高德地图sdk连续定位,高德地图实战：后台持续定位实现

linux没有.brashrc文件,RHCE认证学习笔记-第四天

【笔记3-7】CS224N课程笔记 - 神经网络机器翻译seq2seq注意力机制

每日一书丨地表最强：iOS安全黑宝书中文版来袭

电能管理系统电力监控系统解决方案

计算机笔试知识题库及答案解析,计算机笔试题库及答案.docx

SunDay天气--第二弹

干货速收藏！影视混剪必备的5个素材网站，高清无水印资源下载