点上方蓝字计算机视觉联盟获取更多干货

在右上方 ··· 设为星标 ★,与你不见不散

仅作学术分享,不代表本公众号立场,侵权联系删除

转载于:机器之心

AI博士笔记系列推荐

周志华《机器学习》手推笔记正式开源!可打印版本附pdf下载链接

香港中文大学多媒体实验室(MMLab)OpenMMLab 开源一体化视频目标感知平台 MMTracking。

新年伊始,香港中文大学多媒体实验室(MMLab)OpenMMLab 又有新动作,发布了一款一体化视频目标感知平台 MMTracking。该框架基于 PyTorch 写成,支持单目标跟踪、多目标跟踪与视频目标检测,目前已开源。

GitHub 地址:https://github.com/open-mmlab/mmtracking

MMTracking 效果展示。

据介绍,MMTracking 具备以下主要特性:

1. 首个开源一体化视频目标感知平台

对视频内的目标进行感知识别一直是学界、业界都非常关心的问题。这个问题在学界常被细分为不同的子问题,比如视频目标检测、多目标跟踪与单目标跟踪。具体来说,

  • 视频目标检测只需对视频内的每一帧进行检测,不要求对不同帧中的同一目标进行关联。

  • 多目标检测在完成视频目标检测的基础上,更加侧重于对视频内的同一目标进行关联。

  • 单目标跟踪更加侧重人机交互,算法需要在给定一个任意类别、任意形状目标的情况下,对其进行持续跟踪。

近几年来,虽然各个任务都涌现了许多优秀的算法,但这些领域仍然缺少开源的代码框架,给代码复现、借鉴、公平对比带来了很大困难。OpenMMLab 将这些任务融合到了同一框架下,希望能够作为开源的一体化视频目标感知平台,推动不同子领域间的融合、互促与发展。

2. OpenMMLab 内部项目间的充分交互

视频目标感知在大部分情况下可以认为是 2D 目标检测的下游任务,十分依赖各种 2D 目标检测算法。在此之前,如何使用或切换不同的 2D 目标检测器其实是一个很烦琐耗时的任务。

MMTracking 充分利用了 OpenMMLab 其他平台的成果与优势,比如它 import 或继承了 MMDetection 中的大部分模块,极大地简化了代码框架。在这种模式下,通过 configs 可以直接使用 MMDetection 中的所有模型。以多目标跟踪举例,每一个多目标跟踪模型多由以下几个模块组成:

import torch.nn as nnfrom mmdet.models import build_detectorclass BaseMultiObjectTracker(nn.Module):def __init__(self,detector=None,reid=None,tracker=None,motion=None,pretrains=None):self.detector = build_detector(detector)...

Configs 示例:

model = dict(type='BaseMultiObjectTracker',detector=dict(type='FasterRCNN', **kwargs),reid=dict(type='BaseReID', **kwargs),motion=dict(type='KalmanFilter', **kwargs),tracker=dict(type='BaseTracker', **kwargs))

现阶段的 ReID 模型也继承了 MMClassification 中的一些模块并将在后期增加其他支持。

受益于 OpenMMLab 的这种模块化设计,MMTracking 可以利用其他图像级平台的已有成果,从而只需要注重视频部分模块的设计与开发。同时,如果用户需要单独训练一个目标检测器,该工具也支持直接使用 MMDetection 的 configs 进行训练,只需要在 config 中添加一句 USE_MMDET=True 即可将模式切换到 MMDetection 下,进行前序模型训练。

3. 高效、强大的基准模型

视频目标感知领域中的不同方法往往各成一派,缺乏公认的训练方法与准则,因此在很多时候很难做到真正的公平对比。

MMTracking v0.5 复现了各个领域的主流算法,包括:

  • 视频目标检测:DFF、FGFA、SELSA

  • 多目标跟踪:SORT、DeepSORT、Tracktor

  • 单目标跟踪:SiameseRPN++

据 OpenMMLab 知乎文章介绍,MMTracking 在保证高效训练与推理的基础上,有些模型甚至超出官方实现,例如:

  • 对视频目标检测算法 SELSA 的实现结果(第一行)相比于官方实现(第二行),在 ImageNet VID 数据集上 mAP@50 超出 1.25 个点。

  • 对多目标跟踪算法 Tracktor 的实现结果(第一行)相比于官方实现(第二行),在 MOT17 数据集上 MOTA 超出 4.9 个点,IDF1 超出 3.3 个点。

  • 对单目标跟踪算法 SiameseRPN++ 的实现结果(第一行)相比于官方实现(第二行),在 LaSOT 数据集上的 Norm precision 超出 1.0 个点。

OpenMMLab 知乎文章:https://zhuanlan.zhihu.com/p/341283833

end

我是王博Kings,一名985AI博士,在Github上开源了机器学习、深度学习等一系列手推笔记,获得了不少同学的支持。

这是我的私人微信,还有少量坑位,可与相关学者研究人员交流学习 

目前开设有人工智能、机器学习、计算机视觉、自动驾驶(含SLAM)、Python、求职面经、综合交流群扫描添加CV联盟微信拉你进群,备注:CV联盟

王博的公众号,欢迎关注,干货多多

王博的系列手推笔记(附高清PDF下载):

博士笔记 | 周志华《机器学习》手推笔记第一章思维导图

博士笔记 | 周志华《机器学习》手推笔记第二章“模型评估与选择”

博士笔记 | 周志华《机器学习》手推笔记第三章“线性模型”

博士笔记 | 周志华《机器学习》手推笔记第四章“决策树”

博士笔记 | 周志华《机器学习》手推笔记第五章“神经网络”

博士笔记 | 周志华《机器学习》手推笔记第六章支持向量机(上)

博士笔记 | 周志华《机器学习》手推笔记第六章支持向量机(下)

博士笔记 | 周志华《机器学习》手推笔记第七章贝叶斯分类(上)

博士笔记 | 周志华《机器学习》手推笔记第七章贝叶斯分类(下)

博士笔记 | 周志华《机器学习》手推笔记第八章(上)

博士笔记 | 周志华《机器学习》手推笔记第八章(下)

博士笔记 | 周志华《机器学习》手推笔记第九章

点个在看支持一下吧

港中文开源 | 融合视频目标检测与单目标、多目标跟踪相关推荐

  1. 融合视频目标检测与单目标、多目标跟踪,港中文开源一体化视频感知平台 MMTracking...

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 编辑丨机器之心 魔王 香港中文大学多媒体实验室(MMLab)OpenMMLab 开源一体化视频目标感知 ...

  2. 视频目标检测与图像目标检测的区别

    一. 前言 本文介绍了知乎上关于视频目标检测与图像目标检测的区别的几位大佬的回答.主要内容包括有视频目标检测与图像目标检测的区别.视频目标检测的研究进展.研究思路和方法. 作者:Naiyan Wang ...

  3. MAML-Tracker:用目标检测思路做目标跟踪?小样本即可得高准确率丨CVPR 2020

    来源 | 微软研究院AI头条(ID: MSRAsia) 编者按:目标检测与目标跟踪这两个任务有着密切的联系.针对目标跟踪任务,微软亚洲研究院提出了一种通过目标检测技术来解决的新视角,采用简洁.统一而高 ...

  4. CVPR 2020丨MAML-Tracker: 用目标检测思路做目标跟踪? 小样本即可得高准确率

    编者按:目标检测与目标跟踪这两个任务有着密切的联系.针对目标跟踪任务,微软亚洲研究院提出了一种通过目标检测技术来解决的新视角,采用简洁.统一而高效的"目标检测+小样本学习"框架,在 ...

  5. 目标检测综述——单阶段检测器

    文章目录 一.SSD((Single Shot MultiBox Detector)) 1.Default box 2.训练过程 3.数据增强 4.其他变体 (1)DSSD (2)DSOD (3)FS ...

  6. 目标检测随笔1——目标检测简要综述

    车牌识别demo网址 http://www.openalpr.com/demo-image.html 以下转自: http://imbinwang.github.io/blog/object-dete ...

  7. 基于深度学习的目标检测综述(单阶段、多阶段、FPN变体、旋转目标检测等)

    随着深度学习的发展,基于深度学习的目标检测方法因其优异的性能已经得到广泛的使用.目前经典的目标检测方法主要包括单阶段(YOLO.SSD.RetinaNet,还有基于关键点的检测方法等)和多阶段方法(F ...

  8. 目标检测之小目标检测和遮挡问题

    小目标检测trick 小目标难检测原因 小目标在原图中尺寸比较小,通用目标检测模型中,一般的基础骨干神经网络(VGG系列和Resnet系列)都有几次下采样处理: 导致小目标在特征图的尺寸基本上只有个位 ...

  9. win10,vs2015深度学习目标检测YOLOV5+deepsort C++多目标跟踪代码实现,源码注释,拿来即用。

    打死不用CSDN,整改的太恶心了,发什么都审核不过,各种图片和链接不让发.人如果没有立场那还是人吗?不用CSDN并且博客园就很好! DeepSort纯C++ Yolov5[s,l,m系列],详细讲解- ...

最新文章

  1. ubuntu 安装 Sublime Text 2
  2. 用oracle的ODP.NET创建实体数据模型
  3. python使用线性回归实现房价预测
  4. android 中自定义键盘,【图片】自定义属于自己的专属键盘的思路!!!(需要有android编程基础)【exagear吧】_百度贴吧...
  5. CSS - 层叠特性
  6. 使用Python实现电子邮件群发功能
  7. 此url不支持http方法get_HTTP 入门
  8. star法则开发简历模板_软件开发的第一法则
  9. 矩阵乘法、转置矩阵、对称矩阵
  10. 02组团队项目-Alpha冲刺-4/6
  11. 利用python脚本实现批量添加jira用户功能
  12. pytest与coverage联合使用
  13. Lib之过?Java反序列化漏洞通用利用分析
  14. sm2262en怎么量产?sm2262en量产工具,sm2263en开卡软件,sm2263en、sm2262en使用量产工具成功开卡的方法指引
  15. docker-compose设置redis密码
  16. AForge学习笔记(10):AForge.Imaging.Filters
  17. 307 跳转会携带请求方法吗_瘦得最快的有氧运动,你小时候常玩|跳绳|开合跳|有氧运动|快走|减肥|燃脂...
  18. hdu 1347 Grandpa is Famous
  19. IDS国际数据空间(工业数据空间)
  20. Response 对象 错误 'ASP 0156 : 80004005'

热门文章

  1. 用户登录色一句java_SpringBoot中用SpringSecurity实现用户登录并返回其拥有哪些角色...
  2. gm21模型python_python使用GM11
  3. c语言用户登录成功才能,c语言用户登录.docx
  4. ha linux 设置虚拟ip_如何在虚拟机中设置CentOS静态IP?
  5. php中的rand,php rand() 随机数生成的方法介绍
  6. 蓝牙耳机按键事件linux,调用蓝牙耳机的按键,或者有线耳机的按键方法?
  7. c99什么意思_C语言中%c,%s分别代表什么意思?
  8. java中什么泛型_java中的泛型(一)
  9. html5上传视频和预览,HTML5 上传前预览
  10. 前端基础进阶(二):执行上下文详细图解