亚运会倒计时!AI目标检测助力亚运陈共举办!
关注并星标
从此不迷路
计算机视觉研究院
公众号ID|ComputerVisionGzq
学习群|扫码在主页获取加入方式
计算机视觉研究院专栏
作者:Edison_G
目标检测是现在最热门的研究课题,目前最流行的还是Yolo系列框架,最近我们计算机视觉研究院也分享了很对目标检测干活及实践,都是Yolo-Base框架,今天我们分享一个经过修改后的Yolov5,实时检测的效果!
开源代码:https://github.com/ultralytics/yolov5/releases
01
前言
目标检测是现在最热门的研究课题,现在的框架越来越多,但是技术的新颖性到了瓶颈,目前开始流行Transformer机制,而且在目标检测领域也能获得较大的提升,也是目前研究的一个热点。
即将举行的亚运会,将会投入更多的先进科技,比如3D成像、姿态估计、目标检测、跟踪及识别!让去全世界看到不一样的中国,不一样的科技,不一样的亚运会。今天我们就说说目标检测会在亚运会中的体现!
目前最流行的还是Yolo系列框架,最近我们“计算机视觉研究院”也分享了很对目标检测干活及实践,都是Yolo-Base框架。
高斯YoloV3目标检测(文中供源码链接)
Yolo轻量级网络,超轻算法在各硬件可实现工业级检测效果(附源代码)
不再只有Yolo,现在轻量级检测网络层出不穷(框架解析及部署实践)
CVPR21目标检测新框架:不再是YOLO,而是只需要一层特征(干货满满,建议收藏)
02
新框架改进
今天我们分享一个经过简单优化过的Yolov5,暂时命名为:Pad-YoloV5,在IPad上可以实时检测!基于YoloV5框架,熟悉的同学应该都不用多加解释。
YoloV4在YoloV3的基础上增加了近两年的研究成果,如下:
输入端采用mosaic数据增强
Backbone上采用了CSPDarknet53、Mish激活函数、Dropblock等方式。(cspnet减少了计算量的同时可以保证准确率)
Mish函数为:
Neck中采用了SPP、FPN+PAN的结构,
输出端则采用CIOU_Loss、DIOU_nms操作
YoloV5主要的改变,如下:
输入端:Mosaic数据增强、自适应锚框计算
Backbone:Focus结构,CSP结构
Neck:FPN+PAN结构
Prediction:GIOU_Loss
这次主要优化,是YoloV5在数据增强的时候,用随机缩放、随机裁剪、随机排布的方式进行拼接,这个对于小目标的检测效果还是很友好的。通过实验发现,这个随机拼接和有规律的拼接,最终的结果还是有一点差别的。
首先我通过修改数据增强的策略,开始对整体数据集进行统计(也就是数据预处理分析),我大致分成三个范围。将最大的与最小的进行随机拼接,最终结果确实比整体随机的效果好!
其次,稍微修改了下自适应图片缩放策略,Yolov5代码中datasets.py的letterbox函数中进行了修改,对原始图像自适应的添加最少的黑边。我是在自适应缩放后的图片,我在右下角位置填边,其实大多数数据没有什么变化,只是随便改改,因为在线都是在Yolo的基础上增加最近几年新出的策略,确实在最后的检查有一定效果的增加。
最后的修改,就是辛苦的把Transformer机制加进了YoloV5的基础框架中,训练确实加快了,但是对于用笔记本训练的成果物,还是不够明显。这也是最近第一次分享实践过程的一些小心思,具体的细节我们“计算机视觉研究院”后期会通过一篇干活详细和大家分享!
© THE END
转载请联系本公众号获得授权
计算机视觉研究院学习群等你加入!
计算机视觉研究院主要涉及深度学习领域,主要致力于人脸检测、人脸识别,多目标检测、目标跟踪、图像分割等研究方向。研究院接下来会不断分享最新的论文算法新框架,我们这次改革不同点就是,我们要着重”研究“。之后我们会针对相应领域分享实践过程,让大家真正体会摆脱理论的真实场景,培养爱动手编程爱动脑思考的习惯!
扫码关注
计算机视觉研究院
公众号ID|ComputerVisionGzq
学习群|扫码在主页获取加入方式
往期推荐
欢迎关注我的公众号 [极智视界],回复001获取Google编程规范 O_o >_< o_O O_o ~_~ o_O 大家好,我是极智视界,本文介绍一下克莱 ... 由于目前的imglabel画出来框都是voc类型的xml文件: <annotation><folder>rotate_jueyuanzi_zip</folder>& ... 不到现场,照样看最干货的学术报告! 嗨,大家好.这里是学术报告专栏,读芯术小编不定期挑选并亲自跑会,为大家奉献科技领域最优秀的学术报告,为同学们记录报告干货,并想方设法搞到一手的PPT和现场视频--足 ... AI有道 不可错过的AI技术公众号 关注 1 Object Localization 前两节课程中,我们介绍的是利用CNN模型进行图像分类.除此之外,本周课程将继续深入介绍目标定位和目标检测(包含多目 ... 红色石头的个人网站:redstonewill.com <Convolutional Neural Networks>是Andrw Ng深度学习专项课程中的第四门课.这门课主要介绍卷积神经网 ... 在哲威老师与各位同学 畅聊旷视研究院AI计算组的宝藏科技 -RIFE 光流估计算法后 我们接着与大家一起探索 目标检测的现在和未来 这个暑假,跟紧旷妹的脚步 缓解你的CV焦虑感,斩获CV幸福感! 本期 ... 码字不易,欢迎给个赞! 欢迎交流与转载,文章会同步发布在公众号:机器学习算法全栈工程师(Jeemy110) 目录 目录 概述 数据集和性能指标 数据集 性能指标 R-CNN SPP-net Fast ... 本文目录 简述 1.MMrotate下载 2.环境安装 3.自定义数据集制作 3.1 roLabelImg 打标签 3.2 生成DOTA数据集格式的标签 3.3 数据集裁剪(split) 4.修改配置 ... 国际计算机视觉与模式识别会议(CVPR)是计算机科学领域中的顶级会议之一,也是图像处理.机器学习.人工智能等多个领域的交叉学科会议. 每年的CVPR会议都会有大量的论文投稿和学术交流活动,其中涵盖了包 ...亚运会倒计时!AI目标检测助力亚运陈共举办!相关推荐
最新文章
热门文章