万年潜水党,上来答一发。

利益相关:名字在 author list 里。

今天(10.12)正式开源了两个项目,mmcv 和 mmdetection。(划重点:for pure research)

mmdetection 是基于我们 COCO 比赛(Detection 2018 winner)时的 codebase 重构,先放一张 test-dev 的结果。

Workshop 讲 talk 的时候反应很热烈的经验总结部分是 @Jianping Shi 的建议,顺带致谢一波。

mmdetection 原计划九月底 release,由于某些不可抗力(比如拖延症)延迟到了现在,感觉如释重负。第一个版本中实现了 RPN,Fast R-CNN,Faster R-CNN,Mask R-CNN,近期还计划放出 RetinaNet 和 Cascade R-CNN。(如果由于赶 CVPR 跳票了,请不要介意,介意也不会release的)

先简单介绍一下和 Detectron 的对比performance 稍高

训练速度稍快

所需显存稍小

但更重要的是,基于 PyTorch 和基于 Caffe2 的 code 相比,的易用性是有代差的。成功安装 Detectron 的时间,大概可以装好一打的 mmdetection 吧。

当然 Detectron 有些优势也很明显,作为第一个全面的 detection codebase,加上 FAIR 的金字招牌,关注人数和用户很多(虽然吐槽也比较多),release 的模型也比较全面。我们也在努力扩充 model zoo,奈何人力和算力还是有很大差距,所以还需要时间。

具体说说上面提到的三个方面吧。首先是 performance ,由于 PyTorch 官方 model zoo 里面的 ResNet 结构和 Detectron 所用的 ResNet 有细微差别(mmdetection 中可以通过 backbone 的 style 参数指定),导致模型收敛速度不一样,所以我们用两种结构都跑了实验,一般来说在 1x 的 lr schedule 下 Detectron的会高,但 2x 的结果 PyTorch 的结构会比较高。

速度方面 Mask R-CNN 差距比较大,其余的很小。采用相同的 setting,Detectron 每个 iteration 需要 0.89s,而 mmdetection 只需要 0.69s。Fast R-CNN 比较例外,比 Detectron 的速度稍慢。另外在我们的服务器上跑 Detectron 会比官方 report 的速度慢 20% 左右,猜测是 FB 的 Big Basin 服务器性能比我们好?

显存方面优势比较明显,会小 30% 左右。但这个和框架有关,不完全是 codebase 优化的功劳。一个让我们比较意外的结果是现在的 codebase 版本跑 ResNet-50 的 Mask R-CNN,每张卡(12 G)可以放 4 张图,比我们比赛时候小了不少。

具体的对比数据可以在 github 页面上找到。open-mmlab/mmdetection​github.com

顺带介绍一下 mmcv,mmcv 和 mmdetection 同属于 open-mmlab 项目,这个项目会将我们 lab 的一些 research project 有计划、系统性地开源。mmcv 是一个基础库,主要分为两个部分,一部分是和 deep learning framework 无关的一些工具函数,比如 IO/Image/Video 相关的一些操作,另一部分是为 PyTorch 写的一套训练工具,可以大大减少用户需要写的代码量,同时让整个流程的定制变得容易。open-mmlab/mmcv​github.com

欢迎 star/fork/watch/pr/research 交流。

怎么看mmdetection版本_如何评价商汤开源的 mm-detection 检测库?相关推荐

  1. python目标跟踪_商汤开源最大目标跟踪库PySOT,代码已正式上线!

    前几天 CVer推送一篇:重磅!商汤开源最大目标跟踪库PySOT:含SiamRPN++和SiamMask等算法,介绍了来自商汤科技的STVIR(SenseTime Video Intelligence ...

  2. 新思路!商汤开源利用无标注数据大幅提高精度的人脸识别算法

    出处"来自微信公众号:我爱计算机视觉" 新思路!商汤开源利用无标注数据大幅提高精度的人脸识别算法 这篇论文解决的问题与现实中的人脸识别应用场景密切相关,其假设已经有了少量已经标注的 ...

  3. 港中大、商汤开源目标检测工具包mmdetection,对比Detectron如何?

    近日,香港中文大学-商汤联合实验室开源了基于 PyTorch 的检测库--mmdetection.上个月,商汤和港中大组成的团队在 COCO 比赛的物体检测(Detection)项目中夺得冠军,而 m ...

  4. ICCV2019 视频理解比赛冠军代码库,商汤开源X-Temporal

    作者:商汤 X-Lab 组 编译:CV君 今天,来自商汤科技的 X-Lab 组开源了用于视频理解的代码库X-Temporal,提供了一众 State-of-the-art 的视频分类模型. 该库基于 ...

  5. 大商创x支持mysql版本_【大商创安装】大商创X宝塔面板安装配置简述

    1.安装宝塔 服务器系统centos执行: yum install -y wget && wget -O install.sh http://download.bt.cn/instal ...

  6. idea怎么看jdk版本_怎么看自己的jdk版本

    这个主要是在cmd下输入java-version来查看,64位的效果如下:如果没有标明是多少位的,默认一般是32位的,希望对你有用,我是ndk吧吧主,有问题可以ndk吧留言,谢谢! . 就安装最新版就 ...

  7. lgg8各个版本_如何评价LG G8?

    回复下吧,产品中规中矩的升级,奈何同期对手太强,宣发脑子被驴踢. 前置TOF早有透露,自家lg innotek的产品,效果不错,能更好3d人脸自拍,人脸识别,以及AR,都9012了搞隔空操作还作为宣传 ...

  8. 如何看mysql版本_如何查看mysql版本的四种方法,MySQL版本查看

    1:在终端下:mysql -V. 以下是代码片段: [shengting@login ~]$ mysql -V mysql Ver 14.7 Distrib 4.1.10a, for redhat-l ...

  9. GitHub 标星 20000+,国产 AI 开源从算法开始突破 | 专访商汤联合创始人林达华

    作者 | 阿司匹林 责编 | 李雪敬 封图 | CSDN 下载自视觉中国 作为已经有4000多名员工的AI独角兽,商汤的一举一动备受关注. 从2018年开始,奔着"开源.统一.可复现&quo ...

最新文章

  1. 使用OpenCV进行对象检测
  2. java中的队列详解
  3. HeadFirst设计模式(四) - 工厂模式之1 - 简单工厂
  4. Codevs2822 爱在心中
  5. 暂存单点传播帧,以及使用 TIM 来传递
  6. java private 接口_java接口中 定义 private 私有方法
  7. sql server版本特性简介、版本介绍简介
  8. JAVA设计模式之单例设计模式
  9. termux php 出错,android上的终端——termux
  10. 通过字符串方法创建新字符串如何打出反斜杠、单引号、双引号、响铃、换行符、水平制表符
  11. javascript中的this指向问题
  12. 云计算8项核心技术分析
  13. 代码审计:企业级web代码安全架构读书笔记(二)
  14. 梶田秀司 仿人机器人学习笔记(一)书本第一章
  15. 如何在新的Apple TV遥控器上调整触摸灵敏度
  16. 教你如何使用语雀提高效率
  17. 樊胜美有可能跑到与安迪一样的终点…
  18. 新人学习java导论
  19. 狼来了,海康威视被黑客入侵,视频监控设备被境外IP地址控制
  20. 语义通信(Semantic Communication)

热门文章

  1. [人脸识别]什么叫One-shot learning
  2. 倾斜摄影和近景摄影技术
  3. 超简单的Springboot中的日志管理配置
  4. 循序渐进学Python 1 安装与入门
  5. 初识webservice 服务
  6. 延时执行和取消延时执行
  7. 我平时比较喜欢的几篇技术文章
  8. Java中split函数的用法及使用示例
  9. 概率中的独立和不相关
  10. 【机器学习】隐马尔可夫模型及其三个基本问题(一)