2018 COCO+Mapillary 联合挑战赛颁奖现场

当地时间 9 月 8 日,两年一度、为期一周的欧洲计算机视觉顶级学术会议 ECCV 2018 在德国慕尼黑拉开帷幕。据官方信息显示,ECCV 2018 共有 43 场 Workshops 和 11 场 Tutorials;大会投稿论文 2439 篇,其中接收论文 776 篇(31.8%);注册参会人数近 3200 人,规模空前,超过 ECCV 2016(阿姆斯特丹)2 倍。旷视科技研究院在院长孙剑博士的带领下远赴盛会,用心用力,推动全球范围计算机视觉的技术交流与产品落地。

9 月 9 日,43 场 Workshops 中最为引人注目的 Joint COCO and Mapilary Recognition Challenge Workshop(COCO+Mapillary 物体识别联合挑战赛研讨会)在慕尼黑技术大学(Technische University Munich)如期召开,公布各个赛项最终成绩,开展研讨会交流。值得一提的是,这次联合挑战赛的夺冠队伍全部来自中国。

这次联合挑战赛中, COCO 4 项比赛,Mapillary 2 项比赛,共计 6 个赛项。旷视科技参战其中的 3 项 COCO 比赛和 1 项 Mapillary 比赛,共计 4 个赛项,分别荣获 3 项 COCO 第一( 含 1 项并列第一)和 1 项 Mapillary 第一,四战皆胜,可谓揽下了本次挑战赛的“半壁江山”,成为当之无愧的最大赢家。自 ICCV COCO+Places 2017 拿下 3 项第一,打破谷歌、微软“霸权”,成为第一个问鼎 COCO 冠军的中国公司之后,本次 ECCV COCO+Mapillary 2018 旷视科技参战四项,拿下四冠,全战皆胜突破自我再创新高,彰显了在物体识别与检测领域的绝对实力。

2018 COCO+Mapillary 官方结果:旷视科技(Megvii)荣获四冠,分别是 COCO detection(并列第一)、COCO keypoints、COCO panoptic 和 Mapillary panoptic。

COCO 2018 联合挑战赛的本意是在场景理解的前提之下研究物体识别,这次 COCO 挑战赛项有 1)Instance Segmentation(实例分割),2)Panotic  Segmentation(全景分割),3)Keypoints(人体关键点检测)和 4)DensePose(人体密集姿态估计);Mapillary 挑战赛项有 1)Instance Segmentation(实例分割)和 2)Panoptic  Segmentation(全景分割)。尽管 COCO 和 Mapillary 共同聚焦在视觉识别的一般问题之上,但是具体的每项任务在相应数据集的加持下还是对问题的不同维度做了新探索。COCO(& Mapillary)是当前物体识别领域最为权威、最具标杆作用的数据集之一,也是继 ImageNet 之后最有影响力的竞赛平台之一。

COCO 是英文 Commen Objects in Context 的缩写,并有同名论文发布。COCO 数据集针对全场景理解而设计,意在促进物体检测研究发展。 Mapillary Vistas 是新近推出的街景集图像数据集,专注于图像的高阶语义理解,推动自动驾驶和机器人导航等领域的技术落地。在数据集和应用任务方面,两者有很多不同,而后者对前者起补足作用。通常来讲,COCO 是自然场景下的物体识别,Mapillary 则聚焦于街景场景识别,因此联合挑战赛的形式有利于计算机视觉技术更贴近现实场景,更具应用价值。

自 2015 年首届挑战赛以来,COCO 赛项数量不断更新,评估标准也更加复杂;COCO 2018 相较往年又有改变。在检测方面,实例分割近年在 COCO 上大为流行,今年,COCO 和 Mapillary 都有此赛项;随着检测技术走向饱和,COCO 去掉了边界框检测这一赛项,但成绩依然出现在榜单上。另外一个变动是新增了 DensePose 和 Panoptic Segmentation 两个赛项。Panoptic Segmentation 同时解决一张图像上前景物体与背景物体的分类问题,把互为分裂的语义分割和实例分割整合为一,推动分割技术步入新境界,不断逼近现实应用。COCO 和 Mapillary 也都有此赛项。

这次挑战赛在 COCO 和 Mapillary 两个重量级数据集的加持之下,为重新定义和升级机器视觉算法提供了一次宝贵的机会。激发新洞见,这可以说是 COCO & Mapillary 2018 的最大价值所在。三项冠军的比赛结果不仅再次向世界证实了旷视科技计算机视觉原创技术的非凡实力,也体现了公司内部自成一格孕育冠军的“大环境”的科学性和创新性。技术是一切的前提,一次次的冠军就是技术。以非凡科技,持续为客户和社会创造最大价值,旷视科技正在把口号化为现实。

正如旷视研究院检测组负责人俞刚博士所讲:“上年 COCO 比赛让我更多看到的是,我们扎实的细节积累和公司平台的优势。但是今年,团队乐观的信念和对胜利的坚持深深感动了我。每次当我们满怀希望的 idea 出结果时,往往都是以失望而告终。但是我们从未因为挫折而沮丧,每次都能快速站起来,反思问题,继续下一个 idea,这正是我们这次拿下四冠的“丹法”所在。做 Research 没有捷径,唯有不断创新和坚持。”

旷视科技首席科学家、旷视研究院院长孙剑博士也表示:“COCO 竞赛有点像华山论剑,大家来比比过去一年功夫练的怎么样。其实除了成绩,我更看重的是这个参赛过程对队伍锤炼,包括心力和坚毅。真正的华山论剑是科技产品在市场上的竞争,旷视科技永远争第一。

雷锋网版权文章,未经授权禁止转载。详情见转载须知。

ECCV 2018 | 旷视科技包揽COCO+Mapillary四项世界第一,中国公司成最大赢家相关推荐

  1. 空间金字塔池化_CVPR 2018 | 旷视科技人体姿态估计冠军论文——级联金字塔网络CPN...

    全球计算机视觉顶会 CVPR 2018 (Conference on Computer Vision and Pattern Recognition,即IEEE国际计算机视觉与模式识别会议)将于6月1 ...

  2. CVPR 2018 | 旷视科技Face++率先提出DocUNet 可复原扭曲的文档图像

    全球计算机视觉顶会 CVPR 2018 (Conference on Computer Vision and Pattern Recognition,即IEEE国际计算机视觉与模式识别会议)将于6月1 ...

  3. CVPR 2018 | 8篇论文、10+Demo、双项挑战赛冠军,旷视科技掀起CVPR产学研交流热潮

    第 31 届计算机视觉和模式识别大会 CVPR 2018(Conference on Computer Vision and Pattern Recognition)在 6 月 18 日至 22 日于 ...

  4. R Talk | 旷视科技孙剑博士:云、端、芯上的视觉计算

    「R Talk 」是一个深度学习专栏,将通过不定期的推送展示旷视科技的学术分享及阶段性技术成果.「R」是 Research 的缩写,也是旷视研究院的内部代号:而所有「Talk」都是来自旷视 Resea ...

  5. AI技术出海 - 阿里云GPU服务器助力旷视勇夺4项世界第一

    MSCOCO(Microsoft Common Objects in Context)是当今世界计算机视觉领域最受关注和权威的比赛之一.9月9日,COCO+Mapillary物体识别联合挑战赛研讨会在 ...

  6. 旷视科技发布招股书:AI第一股!2018年营收14亿

    昨日凌晨,成立于2011年的中国人工智能企业递交IPO招股书,披露了近年来公司的各项进展. 招股书显示,在业绩期内,旷视的收入由2016年的6778万元增至2017年的3.13亿元,再增至2018年的 ...

  7. 旷视科技2018暑期实习-算法研究员面试记

    下午刚刚参加了旷视科技暑期实习的面试,历时1个小时..(可能因为程序写的太不熟练了) 今年旷视在北航宣讲时我并没有参加,因此没有特意准备过什么方向,只是在官网上投了简历.投完第二天hr小姐姐就给我打电 ...

  8. 旷视科技提出双向网络BiSeNet:实现实时语义分割

    转于:https://zhuanlan.zhihu.com/p/41475332 全球计算机视觉三大顶会之一 ECCV 2018 (European Conference on Computer Vi ...

  9. 三名清华“天才少年”创业,旷视科技冲击IPO,阿里系持股位列第一

    人工智能独角兽旷视科技开始闯关科创板. 3月12日晚,上交所官网显示,旷视科技有限公司首次公开发行存托凭证并在科创板上市申请已获受理. 值得一提的是,旷视科技的三位联合创始人印奇.唐文斌.杨沐毕业于清 ...

最新文章

  1. 如何消除摄影中的运动模糊?
  2. Java程序员从阿里面试回来,这些面试题你们会吗?
  3. 机器人J中WPR_北方工业大学服务机器人研究项目介绍
  4. 直接插入排序(Straight Insertion Sort)
  5. 自定义sql_【PL/SQL 自定义函数】 常用场景
  6. python绘制混淆矩阵_如何实现python绘制混淆矩阵?
  7. strictmath_Java StrictMath nextAfter()方法与示例
  8. Microsoft.Net框架程序设计学习笔记(15):事件之原理分析
  9. 局域网聊天软件的设计思路
  10. python颜色填充代码_求懂WORD的大佬怎么一次性填充颜色或者使用python识别
  11. Nginx+PHP-FPM优化技巧总结(转发别人的,自己留着收藏个记录用)
  12. 文本匹配工具正式开源
  13. HTML+CSS个人简历练习
  14. transcad安装教程_Transcad基础视频教程
  15. 如何利用matlab根据excel画三维图像
  16. elasticSearch搜索引擎安装使用,SprignBoot整合Spring Data Elasticsearch,百度云 Elasticsearch安装包
  17. [观点]中国传统文化的遗失清单上我们丢掉了什么(作者:侯虹斌)
  18. 一个描述二氧化硅的两体势能BKS
  19. KDZD608屏蔽服效率测试仪
  20. python中column什么意思_DataFrame属性和column有什么区别

热门文章

  1. GPT转MBR分区格式图文教程
  2. n个点的简单无向图没有长度为3的环,求其最大的边数
  3. 二,usb描述符-设备 配置 接口 端点
  4. 自注意力机制超级详解(Self-attention)
  5. 入耳式蓝牙耳机哪个牌子好?听歌音质好的蓝牙耳机
  6. 《小软笔记》隐私政策
  7. Ubuntu 16.04 设置菜单栏位置
  8. java计算机毕业设计毕业生离校管理系统源码+mysql数据库+系统+lw文档+部署
  9. 华硕 U系列电脑拆后盖注意事项
  10. VUE | 好看的 404 页面