转载自 | 量子位

作者 | Pine

前脚美团刚发布YOLOv6, YOLO官方团队又放出新版本。

曾参与YOLO项目维护的大神Alexey Bochkovskiy在推特上声称:

官方版YOLOv7比以下版本的精度和速度都要好。

在论文中,团队详细对比了YOLOv7和其他变体的性能对比,并介绍v7版本的新变化。

话不多说,YOLOv7有多强一起来看实验结果。

1

『速度、精度都超越其他变体』

论文中,实验以之前版本的YOLO和最先进的目标检测模型作为基准。

表格是YOLOv7模型在相同的参数设置下与其他版本的比较:

数据标绿代表性能相较于之前版本有所提升,参数量和计算量相较于之前版本,大部分均有所减少,AP也有所提升。

即使在云GPU模型上,最新模型仍可以保持较高的AP,与此同时计算量和参数量相较于之前模型也均有所下降。

YOLOv7可以很好地平衡速度与精度。

与现有的通用GPU和移动GPU的目标检测模型进行比较:

YOLOv7在速度(FPS)和精度(AP)均超过其他目标检测模型。

比如,在输入分辨率为1280时,将YOLOv7与YOLOR进行比较,YOLOv7-W6的推理速度比YOLOR-P6快8fps,检测率也提高了1%AP。

2

『性能是怎么提升的?』

改进实时目标检测模型的性能,往往要从以下几点入手:

1、更快更强的网络架构;
2、更有效的特征集成方法;
3、更准确的检测方法;
4、更精确的损失函数;
5、更有效的标签分配方法;
6、更有效的训练方法。

YOLOv7主要从4、5、6入手设计性能更好的检测模型。

首先,YOLOv7扩展了高效长程注意力网络,称为Extended-ELAN(简称E-ELAN)。

在大规模的ELAN中,无论梯度路径长度和块的数量如何,网络都能达到稳定状态。

但是如果无限地堆叠计算块,这种稳定状态也可能会被破坏,参数利用率也会降低。

E-ELAN对基数(Cardinality)做了扩展(Expand)、乱序(Shuffle)、合并(Merge cardinality),能在不破坏原始梯度路径的情况下,提高网络的学习能力。

在架构方面,E-ELAN只改变了计算块中的体系结构,没有改变过渡层的体系结构。

除了保持原来ELAN的设计架构外,E-ELAN还可以引导不同的计算块组来学习更多样化的特性。

而后,YOLOv7采用基于级联的(Concatenation-based)模型缩放方法。

模型缩放是指调整模型的一些属性,生成不同尺度的模型,以满足不同推理速度的需求。

然而,模型缩放如果应用于基于连接的架构,当扩大或缩小执行深度时,基于连接的翻译层的计算块将减少或增加。

由此可以推断,对于基于级联的模型,不能单独分析不同的缩放因子,必须一起考虑。

基于级联的模型缩放方法是一个复合模型缩放方法,当缩放一个计算块的深度因子时,同时也要计算该块输出通道的变化。

然后,对过渡层以相同的变化量进行宽度因子缩放,这样就可以保持模型在初始设计时的特性,并保持最优结构。

在论文研究中,作者还设计了有计划的重新参数化卷积(Planned re-parameterized convolution)。

RepConv在VGG中有比较优异的性能,但当它直接应用于ResNet、DenseNet或者其他架构时,精度会明显降低。

这是因为RepConv中的直连(Identity connection)破坏了ResNet中的残差和DenseNet中的连接。

因此,论文研究中使用没有直连的RepConv(RepConvN)来设计网络结构。

在YOLOv7的标签分配机制中,需要同时考虑网络预测结果与基准,然后将软标签(综合考虑,优化之后的标签)分配到“label assigner”机制。

那么接下来,“软标签要分配给auxiliary head还是lead head呢?”

论文提出了一种新的标签分配法,如下图中的(d)、(e),基于lead head预测,生成从粗到细的层次标签,分别用于lead head和auxiliary head的学习。

图(d)让较浅的auxiliary head学习lead head已经学习到的信息,而输lead head则可以更专注于为学习到的残差信息。

而e图中,会生成两组软标签,即粗标签和细标签。auxiliary head不如lead head学习能力强,因此要重点优化它的召回率,避免丢失掉需要学习的信息。

目前,YOLOv7已官方开源,有兴趣的伙伴可以戳下文链接。

参考链接:
[1] https://twitter.com/alexeyab84/status/1544877675004788739
[2] https://arxiv.org/abs/2207.02696
[3] https://github.com/WongKinYiu/yolov7/releases

往期精彩回顾适合初学者入门人工智能的路线及资料下载(图文+视频)机器学习入门系列下载中国大学慕课《机器学习》(黄海广主讲)机器学习及深度学习笔记等资料打印《统计学习方法》的代码复现专辑机器学习交流qq群955171419,加入微信群请扫码(读博请说明)

【深度学习】YOLOv7速度精度超越其他变体,大神AB发推,网友:还得是你!|开源...相关推荐

  1. 深度学习究竟怎么入门?两位Google大神掀起剑气之争

    本文经AI新媒体量子位(公众号ID:qbitai )授权转载,转载请联系出处 本文约2000字,建议阅读5分钟. AI界气宗和剑宗大佬争论新手入门AI哪个路径比较好呢? 作为一名深度学习新手,该先学会 ...

  2. 吐血整理深度学习入门路线及导航【教学视频+大神博客+书籍整理】+【资源页】(2019年已经最后一个月了,你还不学深度学习吗???)

    声明: 1)该文章整理自网上的大牛和机器学习专家无私奉献的资料,具体引用的资料请看参考文献. 2)本文仅供学术交流,非商用.所以每一部分具体的参考资料并没有详细对应.如果某部分不小心侵犯了大家的利益, ...

  3. 干货丨深度学习究竟怎么入门?两位Google大神掀起剑气之争

    作为一名(华山派新弟子)深度学习新手,该先学会用框架快速搭出神经网络,用到实际问题中去,还是该先练习用Python基本徒手搭建模型,在小数据集上训练,了解它们的工作原理? 谷歌的两位研究员最近在Twi ...

  4. 不止GPU!这些硬件也影响着深度学习训练速度

    有志于投身人工智能研究的青年,在关注计算机专业选择时,也不妨先了解一下影响深度学习训练速度的种种因素. 本文实验数据来源:知乎@Justin ho 工程师之于计算机就相当于赛车手对待跑车一样,必须十分 ...

  5. 是什么让深度学习再次崛起并超越人类?

    是什么让深度学习再次崛起并超越人类? 2016-03-12 14:44 原创 小芹菜 3条评论 按:作者潘争,格灵深瞳计算机视觉工程师,清华大学自动化系博士,师从智能技术与系统国家重点实验室副主任张长 ...

  6. 深度学习论文TOP10,2019一季度研究进展大盘点

    鱼羊 编译整理 量子位 报道 | 公众号 QbitAI 9012年已经悄悄过去了1/3. 过去的100多天里,在深度学习领域,每天都有大量的新论文产生.所以深度学习研究在2019年开了怎样一个头呢? ...

  7. 深度学习与自然语言处理(4)_斯坦福cs224d 大作业测验1与解答

    深度学习与自然语言处理(4)_斯坦福cs224d 大作业测验1与解答 作业内容翻译:@胡杨(superhy199148@hotmail.com) && @胥可(feitongxiaok ...

  8. 深度学习-11:神经元、神经网络、人脑和卷积神网络

    深度学习-11:神经元.神经网络.人脑和卷积神网络 深度学习原理与实践(开源图书)-总目录 在生物神经网络中,学习源自于大脑中无数神经元之间的连接.大脑接触到新的刺激后,这些神经元之间的连接改变了配置 ...

  9. [深度学习论文笔记]医学图像分割U型网络大合集

    [深度学习论文笔记]医学图像分割U型网络大合集 2015 U-Net: Convolutional Networks for Biomedical Image Segmentation (MICCAI ...

最新文章

  1. 数据蒋堂 | 内置的数据无法实现高性能
  2. android:configChanges=keyboard|keyboardHidden|orientation|screenSize
  3. Flume实操(一)【监控端口数据官方案例】
  4. final 在java,final 在java中的注意点
  5. python的三个特性_Python3.9的7个特性
  6. VC启动窗口画面制作方法研究
  7. Django之Apache2部署
  8. potato土豆引流脚本,potato引流软件工具
  9. Linux之shell编程的shell工具
  10. 支付宝支付即时到账接口在ThinkPHP商城中的应用
  11. nodejs 遍历json数据_异步-使用node.js遍历JSON
  12. ftp上传软件,五款ftp优秀的ftp上传软件
  13. MonthCalendar上使ToolTip随鼠标位置实时变化
  14. 爬虫模拟登录和发表评论
  15. 金仓数据库 KingbaseES 异构数据库移植指南 (4. 应用迁移流程)
  16. 连续十日票房日冠,《人生大事》带热了电影大盘!它凭何突出重围?
  17. 笔记本电脑无法连上WiFi的解决办法
  18. 英语日常口语对话(2)
  19. MMA-符号学运算的奥妙
  20. Android最牛的开源整理

热门文章

  1. 二维数组中的查找--元素从左到右递增,从上到下递增
  2. eureka + kafka +zookeeper
  3. 生产计划自动排程目标是什么?
  4. 普通用户 linux用tar解压文件 无法 open: 没有那个文件或目录
  5. 双球坐标系_坐标系为啥有多种,笛卡尔坐标系、柱坐标系、球坐标系都有啥区别...
  6. VB-Excel编程经历*
  7. 跟鸿蒙林雷组件轮回者势力,遮天的势力分划
  8. 如何将多个PDF文件合并为一个PDF文件?PDF文件合并教程
  9. 从NCBI refseq 中下载特定物种的蛋白质数据
  10. 【经典算法】:翻转句子中单词的顺序