EasyCV 是一个一体化计算机视觉工具箱,以方便使用各种 SOTA 计算机视觉方法。最近,作者将 YOLOX 的改进版 YOLOX-PAI 添加到 EasyCV 中。作者进行消融研究以调查某些检测方法对 YOLOX 的影响。作者还为 PAI-Blade 提供了一个简单的用法,用于加速基于 BladeDISCTensorRT 的推理过程。

最后,在单个 NVIDIA V100 GPU 上在 1.0 毫秒内收到 COCO 数据集上的 42.8 mAP,这比 YOLOv6 快一点。EasyCV 中还设计了一个简单但高效的预测器 api 来进行端到端目标检测。

1、简介

YOLOX 是最著名的单阶段物体检测方法之一,已广泛应用于自动驾驶、缺陷检测等各个领域。它在 YOLO 系列中引入了解耦头和Anchor-free方式,并在 40 mAP 到 50 mAP 之间获得最先进的结果。

考虑到它的灵活性和效率,作者打算将 YOLOX 集成到 EasyCV 中,这是一种一体化的计算机视觉方法,即使是初学者也能轻松使用计算机视觉算法。此外,通过使用检测BackboneNeckHead的不同增强来研究对 YOLOX 的改进。用户可以根据自己的需求简单地设置不同的配置来获得合适的目标检测模型。

此外,基于 PAI-Blade(PAI 的推理优化框架),进一步加快了推理过程,并提供了一个简单的 api 来在 EasyCV 中使用 PAI-Blade。最后,设计了一个高效的预测器 api,以端到端的方式使用 YOLOX-PAI,大大加速了原始 YOLOXYOLOX-PAI 与最先进的目标检测方法之间的比较如图 1 所示。

简而言之,本文的主要贡献如下:

  • EasyCV 中发布YOLOX-PAI 作为一个简单而高效的目标检测工具(包含docker 图像、模型训练、模型评估和模型部署的过程)。希望即使是初学者也可以使用 YOLOX-PAI 来完成他的目标检测任务。

  • 对现有的基于YOLOX 的目标检测方法进行了消融研究,其中仅使用一个配置文件来构建自行设计的 YOLOX 模型。随着架构的改进和 PAI-Blade 的效率,在单个 NVIDIA Tesla V100 GPU 上在 1ms 内获得了 40 mAP 和 50 mAP 中最先进的目标检测结果,用于模型推理。

  • EasyCV 中提供了一个灵活的预测器 API,分别加速了预处理、推理和后处理过程。这样,用户可以更好地使用 YOLOX-PAI 进行端到端的目标检测任务。

2、本文方法

2.1、Backbone

最近,YOLOv6PP-YOLOE 已经将 CSPNetBackbone 替换为 RepVGG。在 RepVGG 中,在推理过程中使用 3×3 的卷积块来代替多分支结构,有利于节省推理时间和提高目标检测结果。在 YOLOv6 之后,还在 YOLOX-PAI 中使用基于 RepVGGBackbone 作为选择。

2.2、Neck

作者使用两种方法来提升 YOLOXYOLOX-PAINeck的性能,即:

  1. 用于特征增强的自适应空间特征融合(ASFF)及其变体(记为ASFF_Sim);

  2. GSConv,一个轻量级的卷积块,以降低计算成本。

原始的 ASFF 方法使用几个 vanilla 卷积块来首先统一不同特征图的维度。受 YOLOv5Focus 层的启发,作者通过使用非参数切片操作和均值操作来替换卷积块以获得统一的特征图(表示为 ASFF_Sim)。具体来说,YOLOX 输出的每个特征图的操作在图 2 中定义。

作者还使用2种基于 GSConvNeck 来优化 YOLOX。使用的 Neck 架构如图3和图4所示。两种架构的区别在于是否将所有块替换为 GSConv。正如作者所证明的那样,GSconv 是专门为通道达到最大和尺寸达到最小的 Neck 设计的。

2.3、Head

作者通过注意力机制增强了 YOLOX-Head,以协调目标检测和分类的任务(表示为 TOOD-Head)。架构如图 5 所示。首先使用一个 Stem 层来减少通道,然后是一组间卷积层以获得间特征图。最后,根据不同的任务计算自适应权重。分别测试了在 TOOD-Head 中使用 vanilla 卷积或基于 repvgg 的卷积的结果。

2.4、PAI-Blade

PAI-Blade 是一个用于模型加速的简单且强大的推理优化框架。它基于许多优化技术,如 Blade Graph OptimizerTensorRTPAI-TAOTensor Accelerator and Optimizer)等。PAI-Blade 将自动搜索优化输入模型的最佳方法。因此,没有模型部署专业知识的人也可以使用 PAI-Blade 来优化推理过程。作者在 EasyCV 中集成了 PAI-Blade 的使用,让用户只需更改导出配置即可获得高效的模型。

2.5、EasyCV Predictor

除了模型推断,预处理功能和后处理功能在端到端目标检测任务中也很重要,而现有的目标检测工具箱往往会忽略这些功能。在 EasyCV 中,作者允许用户灵活选择是否使用预处理/后处理程序导出模型。然后,提供了一个预测器 api 来执行高效的端到端目标检测任务,整个过程只需几行代码。

3、实验

3.1、SOTA对比

3.2、消融实验

1、Backbone的影响

2、Neck的影响

3、Head的影响

4、Blade的影响

4、参考

[1].YOLOX-PAI: An Improved YOLOX Version by PAI

中秋节快乐

YOLOX升级 | 阿里巴巴提出YOLOX-PAI,1ms内精度无敌,超越YOLOv6、PP-YOLOE相关推荐

  1. YOLOX升级 | 阿里巴巴提出YOLOX-PAI,1ms内精度无敌!

    点击下方卡片,关注"自动驾驶之心"公众号 ADAS巨卷干货,即可获取 点击进入→自动驾驶之心技术交流群 后台回复[数据集下载]获取计算机视觉近30种数据集! EasyCV 是一个一 ...

  2. 阿里巴巴提出的中台是什么鬼?终于有人把中台说清楚了

    最近朋友圈被中台刷屏了,那么今天我们来说说中台! 缘起 百度指数搜索"中台",可以发现,中台一词前几年几乎都没有搜索,反倒是今年5月21号开始蹭蹭往上涨! 百度指数 仔细搜索了一下 ...

  3. QQ 浏览器品牌升级,提出「搜刷用看」四项核心功能

    近日,QQ 浏览器正式宣布品牌升级.在平台能力方面,QQ 浏览器提出「搜刷用看」四项核心功能,明确了「内容+服务的综合信息平台」的全新定位,从过去的浏览.搜索工具升级至集合搜索.阅读.娱乐.服务于一体 ...

  4. 【重磅】阿里巴巴创新中心一周内迎两位省委书记视察指导

    开春之际,阿里巴巴创新中心在一周内先后迎来了两位部级领导参观指导,分别是江苏省委书记李强以及黑龙江省委副书记.省长陆昊. 2月23日,江苏省委书记李强来到阿里巴巴创新中心南京高新基地,在阿里巴巴创新中 ...

  5. 微信7.0升级后 高德地图在微信内置浏览器定位失败

    此文为博主原创 转载请注明出处 尊重一下笔者的劳动成果 ⑩分感谢 场景:微信7.0 苹果可以获取到定位 安卓获取不到定位 原因:微信升级7.0做了安全限制 导致使用http的定位不能正常使用 解决办法 ...

  6. 43.6% mAP! 阿里巴巴提出:用于一阶段目标检测的半锚式检测器

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 摘要 标准的一阶段检测器包括两个任务:分类和回归.为特征图中的每个 ...

  7. 阿里巴巴提出Auto-Context R-CNN算法,刷出Faster RCNN目标检测新高度

    基于区域的CNN(R-CNN),在目标检测领域具有统治地位,在兴趣区域(RoI)上的操作比如RoIPooling和RoIAlign扮演了重要角色,但是它们只利用了兴趣区域内的信息,而兴趣区域附近的上下 ...

  8. 清华提出RepMLP:FC“内卷”,卷出性能!

    点击下方卡片,关注"CVer"公众号 AI/CV重磅干货,第一时间送达 作者:丁霄汉  |  已授权转载(源:知乎) https://zhuanlan.zhihu.com/p/37 ...

  9. 阿里巴巴2019春招实习内推

    我们是阿里企业采购技术团队(隶属于阿里巴巴新零售事业群CBU技术部),在C类业务发展比较成熟的情况下,B类业务的企业级市场才是未来.在我们这边,你会真正了解企业电商,和淘宝.天猫完全不一样的电商:一个 ...

最新文章

  1. 人工智能正在引领全球企业的创新
  2. 循序渐进Python3(七) -- 2-- 面向对象进阶
  3. mysql中文长方形_MySql 5.7 中文文档 - 12.16.9.2 使用最小边界矩形的空间关系函数 | Docs4dev...
  4. 数据库性能优化的误区!
  5. Python面向对象中反射和双下的正确用法
  6. 抱抱星英语Antony:不要用互联网思维做教育 | MCtalk教育访谈摘录
  7. Linq 合并数据并相加
  8. 17-mysql-数据定义语言-ddl
  9. 给Execl样式添加配置文件.
  10. 从 0 开始搭建一个技术博客,私藏干货~
  11. 百度如何使用Go语言重构日请求量千亿级别的系统?
  12. HowNet文件介绍
  13. 如何学习、如何画思维导图
  14. 2022.5.23-5.29 AI行业周刊(第99期):AI创业道路
  15. VScode下载及安装完整教程(详细版)
  16. js原生获取html的高度,js中怎么获得浏览器的高度?
  17. stm32f4定时器时钟频率/选择
  18. 未来是机器人还是人类的天下?
  19. Python编程从入门到实践:动手试一试8-3T恤
  20. oracle常见错误码

热门文章

  1. 《第四周RFID作业》物联112118 林家辉
  2. 2021-2026年,全球MPO光纤连接器市场复合年增长率预计为23.2%
  3. 快速学习COSMIC方法之九:如何识别兴趣对象?
  4. C# 下载gif图片,动画丢失,解决办法
  5. python 的 轮子
  6. JavaScript的ES6、ES7、ES8、ES9、ES10新特性
  7. 关于DBC文件的创建
  8. HCE-OS基础介绍
  9. Mysterious Bacteria(唯一质因子解+素数筛)
  10. 深入理解LINUX内核 第三版2.6 笔记