点击上方“3D视觉工坊”,选择“星标”

干货第一时间送达

在2020年中,目标检测领域出现了许多优秀的工作,今天我们来聊一聊在当前热门的五大目标检测开源方案。

1、五大改进,二十多项技巧实验,堪称最强目标检测万花筒:YOLOv4&YOLOv5

论文:YOLOv4: Optimal Speed and Accuracy of Object Detection

COCO AP:55.4

论文地址:https://arxiv.org/pdf/2004.10934.pdf

代码地址:https://github.com/AlexeyAB/darknet

YOLOv5:https://github.com/ultralytics/yolov5

(非官方)源码地址:

  (1) Pytorch版:https://github.com/WongKinYiu/PyTorch_YOLOv4

  (2) tensorflow版:https://github.com/ultralytics/yolov5

YOLOv4试验对比了大量的近几年来最新的深度学习技巧,例如  Swish、Mish激活函数,CutOut和CutMix数据增强方法,DropPath和DropBlock正则化方法,也提出了自己的创新,例如 Mosaic (马赛克) 和 自对抗训练数据增强方法,提出了修改版本的 SAM 和 PAN,跨Batch的批归一化(BN),共五大改进。所以说该文章工作非常扎实,也极具创新。

YOLOv5的工作与YOLOv4十分相近,YOLOv4的网络结构图:

2、基于Transformer的目标检测新范式: DETR

论文:End-to-End Object Detection with Transformers

论文地址:https://arxiv.org/abs/2006.02334

代码地址:https://github.com/facebookresearch/detr

DETR将检测视为集合预测问题,简化了目标检测的整体流程。它没有现在主流的目标检测器中的anchor、label assign、nms等操作,做到了真正的end-to-end。它主要采用了Transformer的编解码结构,它在序列预测任务上大获成功。Transformer中的自注意力机制显示地界定了序列中元素间的相互作用,因此可以用于约束集合的预测结果。

DETR的检测思路是首先使用CNN提取图像特征,然后用transformer模型来检测物体输出set of box predictions ,训练过程采用二分图匹配损失函数。

3、目前最高最快最小模型,可扩缩且高效的目标检测: EfficientDet

论文:EfficientDet: Scalable and Efficient Object Detection

论文地址:https://arxiv.org/abs/2005.12872

代码地址:https://github.com/google/automl

COCO AP: 51.0

(非官方)源码地址:

  (1) Pytorch版:https://github.com/toandaominh1997/EfficientDet.Pytorch

  (2) Keras&&TensorFlow版:https://github.com/xuannianz/EfficientDet

EfficientDet一大创新点是改进了FPN中的多尺度特征融合方式,提出了加权双向特征金字塔网络BiFPN。BiFPN 引入了一种自顶向下的路径,融合P3~P7的多尺度特征, 并且EfficientDet认为FPN中各尺度的特征重要性是不同的,故在BiFPN特征融合的连接中需要加权,而权值是在训练中学习得到的。EfficientDet引入了 EfficientNet 中模型缩放的思想,考虑Input size、backbone Network、BiFPN侧向级联层数、Box/class 层深度作为搜索空间,通过统一的系数缩放(具体方法见原论文),得到了8个不同计算量和参数量的模型。

参考阅读:EfficientDet 算法解读

https://zhuanlan.zhihu.com/p/93241232

4、CenterNet2以56.4mAP超越当前所有检测模型

论文:Probabilistic two-stage detection

论文地址:https://arxiv.org/abs/2103.07461

代码地址:https://github.com/xingyizhou/CenterNet2

COCO AP:  56.4

CenterNet2在目前最先进的One-Stage检测器的基础上建立了一个概率Two-Stage检测器。对于每一阶段的检测,CenterNet2模型都会提取区域级特征并进行分类。在第2阶段使用更快的R-CNN或级联分类器。这两个阶段一起训练,以最大限度地提高预测的概率准确度。在推理中,CenterNet2使用这个最终的对数似然作为检测得分。

结构说明:

参考阅读:Centernet 算法解读

5、特征金字塔与空洞卷积完美结合的目标检测:DetectoRS

论文:DetectoRS: Detecting Objects with Recursive Feature Pyramid and Switchable Atrous Convolution

论文地址:https://arxiv.org/abs/2005.12872

代码地址:https://github.com/joe-siyuan-qiao/DetectoRS

COCO AP: 54.7 AP

DetectoRS是谷歌团队提出的目标检测模型,论文中探讨了目标检测中looking and thinking twice的机制,在宏观上提出了递归特征金字塔RFN(Recursive Feature Pyramid),就是把FPN的输出先连接到bottom up那儿进行再次输入,然后再输出时候与原FPN的输出再进行结合一起输出。在微观上提出了可切换空洞卷积SAC(Switchable Atrous Convolution)。在COCO test-dev中取得了SOTA的结果,目标检测box mAP达到54.7,实例分割mask mAP达到47.1,全景分割PQ达到49.6。

参考阅读:DetectoRS算法解读

本文仅做学术分享,如有侵权,请联系删文。

下载1

在「3D视觉工坊」公众号后台回复:3D视觉即可下载 3D视觉相关资料干货,涉及相机标定、三维重建、立体视觉、SLAM、深度学习、点云后处理、多视图几何等方向。

下载2

在「3D视觉工坊」公众号后台回复:3D视觉github资源汇总即可下载包括结构光、标定源码、缺陷检测源码、深度估计与深度补全源码、点云处理相关源码、立体匹配源码、单目、双目3D检测、基于点云的3D检测、6D姿态估计源码汇总等。

下载3

在「3D视觉工坊」公众号后台回复:相机标定即可下载独家相机标定学习课件与视频网址;后台回复:立体匹配即可下载独家立体匹配学习课件与视频网址。

重磅!3DCVer-学术论文写作投稿 交流群已成立

扫码添加小助手微信,可申请加入3D视觉工坊-学术论文写作与投稿 微信交流群,旨在交流顶会、顶刊、SCI、EI等写作与投稿事宜。

同时也可申请加入我们的细分方向交流群,目前主要有3D视觉CV&深度学习SLAM三维重建点云后处理自动驾驶、多传感器融合、CV入门、三维测量、VR/AR、3D人脸识别、医疗影像、缺陷检测、行人重识别、目标跟踪、视觉产品落地、视觉竞赛、车牌识别、硬件选型、学术交流、求职交流、ORB-SLAM系列源码交流、深度估计等微信群。

一定要备注:研究方向+学校/公司+昵称,例如:”3D视觉 + 上海交大 + 静静“。请按照格式备注,可快速被通过且邀请进群。原创投稿也请联系。

▲长按加微信群或投稿

▲长按关注公众号

3D视觉从入门到精通知识星球:针对3D视觉领域的视频课程(三维重建系列、三维点云系列、结构光系列、手眼标定、相机标定、orb-slam3等视频课程)、知识点汇总、入门进阶学习路线、最新paper分享、疑问解答五个方面进行深耕,更有各类大厂的算法工程人员进行技术指导。与此同时,星球将联合知名企业发布3D视觉相关算法开发岗位以及项目对接信息,打造成集技术与就业为一体的铁杆粉丝聚集区,近2000星球成员为创造更好的AI世界共同进步,知识星球入口:

学习3D视觉核心技术,扫描查看介绍,3天内无条件退款

圈里有高质量教程资料、可答疑解惑、助你高效解决问题

觉得有用,麻烦给个赞和在看~  

盘点热门的目标检测开源方案(附论文+代码下载)相关推荐

  1. 基于YOLOv4的目标检测系统(附MATLAB代码+GUI实现)

    摘要:本文介绍了一种MATLAB实现的目标检测系统代码,采用 YOLOv4 检测网络作为核心模型,用于训练和检测各种任务下的目标,并在GUI界面中对各种目标检测结果可视化.文章详细介绍了YOLOv4的 ...

  2. 一文读懂目标检测模型(附论文资源)

    来源: 大数据文摘 本文共1443字,建议阅读5分钟. 本文为你详细介绍目标检测,并分享资源大礼包,为你的目标检测入门打下基础. 这是一份详细介绍了目标检测的相关经典论文.学习笔记.和代码示例的清单, ...

  3. 无人机下的目标检测研究(附论文下载)

    关注并星标 从此不迷路 计算机视觉研究院 公众号ID|ComputerVisionGzq 学习群|扫码在主页获取加入方式 论文信息:冷佳旭,莫梦竟成,周应华,叶永明,高陈强,高新波*. 无人机视角下的 ...

  4. 2021年目标检测大盘点|目标检测总结——附论文代码下载

    欢迎关注" 计算机视觉研究院 " ----计算机视觉研究院专栏---- 作者:Edison_G 计算机视觉研究院祝贺大家新春快乐! 口令红包????:计算机视觉新春快乐 扫描二维码 ...

  5. ICCV2021最佳检测之一:主动学习框架较大提升目标检测精度(附论文下载)

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 作者丨Edison_G 来源丨计算机视觉研究院 新框架优于基于单模型的方法,并且以一小部分计算成本与基 ...

  6. OpenCV推断onnx格式目标检测模型(SSD)(附完整代码)

    OpenCV推断onnx格式目标检测模型的实例 OpenCV推断onnx格式目标检测模型的实例 OpenCV推断onnx格式目标检测模型的实例 #include <algorithm> # ...

  7. 图像处理算法实战应用案例精讲-【目标检测】YOLO(附python代码实现)

    目录 前言 几个高频面试题目 1.如何对目标物体进行检测? 方法一:窗口切分

  8. CVPR21最佳检测:不再是方方正正的目标检测输出(附源码)

    计算机视觉研究院专栏 作者:Edison_G 有些目标往往具有任意方向的分布.因此,检测器需要更多的参数来编码方向信息,这往往是高度冗余和低效的... 公众号ID|ComputerVisionGzq ...

  9. 通用目标检测开源框架YOLOv6在美团的量化部署实战

    基于美团目标检测模型开源框架 YOLOv6,本文介绍了一种通用的量化部署方案,在保持精度的同时大幅提升了检测的速度,为通用检测的工业化部署探索出一条可行之路,希望能给大家带来一些启发或者帮助. 1. ...

最新文章

  1. Python 爬取北京二手房数据,分析北漂族买得起房吗?(附完整源码)
  2. 【企业管理】2020年3-4 月 每日花语
  3. C++/CLI Winform中调用DLL的三种方法
  4. [论文浅析]ICLR2017 跨语言,跨任务,跨领域序列标注
  5. CDH Hadoop 基于CM方式半在线安装步骤详解
  6. 河北移动引入物联网4G专网APN提升交警执法效率
  7. C/C++:Windows编程—Hook IE浏览器实现URL拦截及更改(上)
  8. 信息学奥赛一本通C++语言——1051:分段函数
  9. 【Kubernetes】Error: Cask minikube is unavailable No Cask with this name exists
  10. 【ASP.NET MVC 学习笔记】- 09 Area的使用
  11. 佳能mp145/mp140/mp288打印机 e16代码怎么处理
  12. 雅思c1语言等级,雅思分数各代表什么水平
  13. QLExpress入门学习
  14. PhalAPI学习笔记拓展篇 ——— 基于MySQL数据库交互题目
  15. matlab 优化 小于,科学网—matlab全局优化与局部优化 - 张凌的博文
  16. 坑爹的MediaPlayer.isPlaying()
  17. Android电池功耗BatteryHistorian数据分析
  18. 《长日将尽》事业禁锢了自我,然`长日终将尽,告别有晴天
  19. 国产精品《仙剑奇侠传5》将至 浅析国内游戏引擎发展史
  20. matlab如何给图片取名,如何给图片命名

热门文章

  1. OpenGL基础知识
  2. rsyslog概要以及源码安装mysql,rsyslog输出到Mysql基于loganalyzer查看分析
  3. Leangoo看板工具做敏捷故事地图看板示例
  4. 干掉 ZooKeeper?阿里为什么不用 ZK 做服务发现?
  5. 万字长文:助你攻破 JAVA NIO 技术壁垒
  6. 如何确定Scrum团队的最佳规模?
  7. 通过改进团队流程最大限度发挥Scrum的优势
  8. 体系化思考,结构化表达
  9. Scrum Master的职业发展路线
  10. 通过OKR复盘会议你会学到哪些?