重磅!商汤&港中文等将开源ECCV2018MS COCO检测比赛冠军代码库

原文出处: 我爱计算机视觉

来自商汤科技、港中文、浙大、悉尼大学、南洋理工大学的研究人员组成的团队MMDet,赢得了ECCV2018 MS COCO检测比赛的冠军。近日,他们将开源在比赛中使用的代码和模型库。

MMDet团队成员:

ECCV2018MS COCO检测比赛结果:

在这个比赛中MMDet团队开发了新的深度学习检测框架,从三个方面区别于以往的框架:一种新的混合级联架构,一种更智能的anchoring机制,一种新的骨干网络FishNet。
(1)使用混合级联架构组织整个流程,不同任务的分支(包括比如包围框回归、掩模预测、语义分割)用交替的方式被组织起来。这种新的架构改进了信息流,以至于不同模块的信息可以更有效的交换。

(2)开发了一种特征引导的anchoring机制,替代传统的密集均匀的anchors。这种机制可以预测任意形状的稀疏anchors,其大幅改进了RPN的性能。(AR上升了大约10%!)

(3)加入了一种新的骨干网(FishNet)到集成模型中,它可以保持并改进不同深度的相同分辨率的特征。

在实验中,使用COCO train2017的标注(bbox, mask,stuff)使用不同的骨干网(分别是SE-ResNeXt-154 (64*4d), ResNeXt-101 (64*4d), ResNeXt-101 (32*8d), DPN-107, and FishNet)训练了5个模型。这些网络预测的结果最后被结合起来,在test-dev上的性能结果是:

(1)单模型(单尺度测试)45.3 mask AP,

(2)单模型(包括图像flip的多尺度测试):47.4 mask AP,

(3)5个模型集成:49.0 mask AP。

目前该工程正在代码整理中,作者称将于9月底正式发布,敬请期待!


Github地址:
https://github.com/open-mmlab/mmdetection

重磅!商汤港中文等将开源ECCV2018MS COCO检测比赛冠军代码库相关推荐

  1. ICCV2019 视频理解比赛冠军代码库,商汤开源X-Temporal

    作者:商汤 X-Lab 组 编译:CV君 今天,来自商汤科技的 X-Lab 组开源了用于视频理解的代码库X-Temporal,提供了一众 State-of-the-art 的视频分类模型. 该库基于 ...

  2. 超越 FPN 和 NAS-FPN!商汤港中文提出 FPG,特征金字塔网格强势登场!

    论文标题:Feature Pyramid Grids 作者团队:商汤&港中文(陈恺&林达华)&南洋理工大学&FAIR 论文链接:https://arxiv.org/ab ...

  3. 强烈推荐!商汤-港中文MMLab开源图像视频超分辨率工具箱MMSR

    点击我爱计算机视觉标星,更快获取CVML新技术 近一年,图像视频超分辨率突然变得异常火热,各大AI巨头和新锐均在发力. 52CV曾经第一时间报道了在今年CVPR 2019上 商汤EDVR算法获NTIR ...

  4. CVPR2020 | 商汤-港中文等提出PV-RCNN:3D目标检测新网络

    关注上方"深度学习技术前沿",选择"星标公众号", 资源干货,第一时间送达! 作者:不一样的子湘 知乎链接:https://zhuanlan.zhihu.com ...

  5. 商汤科技开源DAVIS2017视频目标分割冠军代码

    出处"来自微信公众号:我爱计算机视觉" 商汤科技开源DAVIS2017视频目标分割冠军代码 用目标重识别改进视频目标分割. 传统视频分割经常依赖于时序连续来生成mask(目标的掩膜 ...

  6. 终于!商汤科技开源DAVIS2017视频目标分割冠军代码

    (关注52CV--有价值有深度的公众号~) 用目标重识别改进视频目标分割. 传统视频分割经常依赖于时序连续来生成mask(目标的掩膜),而真实的视频中的目标位置往往存在着一些跳变,比如在目标快速漂移和 ...

  7. 【开源】港中文多媒体实验室开源目标跟踪工具箱MMTracking

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 作者丨OpenMMLab@知乎(已授权) 来源丨https://zhuanlan.zhihu.com/ ...

  8. 商汤港理工提出基于聚类的联合建模时空关系的 GroupFormer 用于解决群体活动识别问题,性能SOTA...

    关注公众号,发现CV技术之美 ▊ 写在前面 群体活动识别是一个关键而又具有挑战性的问题,其核心在于充分探索个体之间的时空交互,产生合理的群体表征 .然而,以前的方法要么分别建模空间和时间信息,要么直接 ...

  9. CVPR2021(Oral) 商汤、港中文实现单目人脸重建新突破: 基于生成网络的渲染器!几何形状更精准!渲染效果更真实!...

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 近日,商汤-港中文联合实验室提出基于风格化对抗生成器的人脸渲染器,用于取代传统图形学基于栅格化的渲染器 ...

最新文章

  1. 多线程编程实践——实现生产者、消费者模型
  2. javascript引用类型
  3. hdu1166敌兵布阵 树状数组裸题
  4. Android 的全盘加密容易破解
  5. Vue2.x源码学习笔记-Vue实例的属性和方法整理
  6. 深入理解Kubernetes容器网络
  7. CSS基础(part20)--CSS3结构伪类选择器
  8. 第二章 Java基本语法(二)
  9. android surfaceview camera,android – 如何在SurfaceView上显示相机预览?
  10. 复制java文件 案例
  11. 智能水位检测系统proteus_浅谈智能视觉检测系统的6大优点
  12. ‘source‘ 不是内部或外部命令,也不是可运行的程序 或批处理文件。
  13. 用一个div模拟textarea的实现【前端每日一题-15】
  14. JMeter压力测试教程(超详细小白版)
  15. 3dmax导入REVIT
  16. 指数加权移动平均法(EWMA)
  17. java实现上传寸照并剪裁,给寸照换背景_用java处置图片(jpg,png,gif.)的背景颜色
  18. 某计算机采用lcd显示器 玩大型游戏,[1]. 液晶显示器(LCD)作为计算机的一种图文输出设备,已逐渐普及,下列关于液晶显示器的叙述中错误的是_______。...
  19. VBA基础知识 提取超链接 批注转内容 工作簿内图片联动
  20. 运行引擎需要d3d11兼容GPU,如何解决

热门文章

  1. 对网上花店系统进行软件测试,网上花店系统
  2. 嵌套 移动端_360PC端小程序全面开放使用
  3. access查询女教师所有的信息_【9月3日报名必看】教师资格证报名如何查询报名成功及修改报名信息?...
  4. python常用的工具函数
  5. 计算机软件的输出设备有哪些,计算机输出设备有哪些?计算机输出设备介绍
  6. python注释_不建议使用Java注释的正确方法
  7. java通过ssh读取日志_IDEA+java通过SSH来进行分析日志,实现UI自动化动态验证码登录...
  8. 皮一皮:学钢琴的重要性!
  9. 今天开始,GitHub将启用main作为默认分支名,master将成为历史!
  10. 面试:Java 泛型背后的原理是什么?