近日,极链科技在Google AI推出的2020 Open Images Challenge大规模目标检测竞赛和国际顶会ECCV 2020 VIPriors挑战赛目标检测赛道中分别获得第一名、第二名的佳绩。

目标检测算法是计算机视觉任务中的重要手段,广泛应用于机器人导航、智能视频监控、工业检测、航空航天等诸多领域,通过计算机视觉减少对人力资本的消耗,具有非常重要的现实意义,因此各种通用目标检测算法竞赛每年也会持续召开。

Open Images是谷歌在2016年推出的大规模图像数据集,包括大约900万张图片,标注了数千个图像类别。并且从2018年开始,谷歌就基于Open Images数据集发起了系列挑战赛。Google在本届挑战赛中更是开放了最新的Open Images V6,希望可以进一步刺激人们对真实场景的理解。

ECCV作为全球三大计算机视觉顶会之一,同样十分关注目标检测领域。ECCV 2020 VIPriors Object Detection挑战赛采用COCO数据集作为训练集以及验证、测试各5000张用于榜单排名。与其他比赛不同的是,该比赛禁止使用任何额外数据集以及预训练模型,即所有模型必须“train from scratch”。初衷是鼓励探索能够高效学习的AI神经网络,降低神经网络训练过程中的人力标注成本和计算资源消耗。

在以上两个国际赛事能够取得好的成绩,极链科技主要使用最新的多阶段目标检测算法,以下做详细说明。

首先,Baseline框架选用Backbone + FPN + DCNv2 + Cascade RCNN,这套组合可以说是最近各种国内外目标检测比赛的常客,不需要做过多解释,这里主要说明一下针对上述两个比赛(以下简称Open Images和VIPriors)在其他模块上的选择。由于两个比赛性质的不同:Open Images数据量较大且允许额外数据、VIPriors数据量较小且不允许预训练及额外数据,对于这些特性我们在算法选择上会有相对的侧重点。

关于Open Images,在参考了前几年获胜队伍的思路后,我们认为取得好成绩的关键在于额外数据以及强大的Backbone。举个例子,去年前四名的队伍都使用了Objects365做为额外数据集,而没有使用任何额外数据的第五名团队最终成绩与第一名团队差了几乎5个百分点的mAP。另一方面,由于Open Images数据量非常大(加上Objects365后更大),在选择Backbone时不难想象越复杂的网络最终的效果越好。基于这两点,我们的最终提交由以下五个模型组成:

l Baseline w/ ResNet-152

l Baseline w/ Res2Net-152

l Baseline w/ ResNeSt-152

l Baseline w/ ResNeSt-152 + Libra

l Baseline w/ ResNeSt-152 + Libra + GCB

每个模型都使用了Open Images + Objects365一起训练以及Multi-Scale Training & Testing,最终融合策略在比较了NMS, Soft-NMS, NMW, TkV,以及WBF后采用了阈值为0.55的WBF。

关于VIPriors,由于其数据量较小(训练集~6000,验证集~5000),我们主要选择以ResNet-50为主的模型(Baseline同上)并将重心放在数据增广上。最终提交使用基于Albumentations, AutoAugment, MixUp, GridMask, Stitchers, Mosaics等不同数据增强组合训练的模型且增加训练时长至72~108周期,相比于传统的在COCO上的1x(即12周期)或2x(即24周期)训练策略增加了4至9倍。应主办方要求,详细的思路已经以报告形式上传至https://arxiv.org/abs/2007.08849

目前,多阶段目标检测算法也应用于极链科技的明星产品——视频结构化数据引擎“金目系统”。该系统利用极链科技自研的VideoAI技术,专注于影视剧和综艺等文娱领域的视频理解,识别视频中的8大数据维度:明星、物体、品牌、场景、表情、动作、地标、事件,并支持基于文本的内容识别(OCR),生成可商业化的结构化标签数据。目前已批量支持互联网广告营销、内容安全审核、智能安防、政企服务等多个应用领域。

极链科技作为一家成立于2014年,以计算机视觉技术驱动的科技公司,不仅在国际国内各大计算机视觉领域竞赛中屡获佳绩,在商业化落地上的表现也是可圈可点,合作伙伴包括爱奇艺、芒果TV、斗鱼直播等一线流量平台,明略科技、艺恩等国内领先的数据服务商,以及具备视频识别技术需要的政企机构。

极链科技聚焦AI在互联网、旅游、安防等领域的商业化落地。未来,极链科技将继续加大投入包括目标检测、人像分割、场景识别等在内的计算机视觉技术在更多细分场景的应用落地,助力产业智能化。

极链科技目标检测获Open Images第一,ECCV 2020挑战赛第二相关推荐

  1. 中国(上海)国际人工智能展览会,极链科技Video++获技术创新奖

    8月30日至8月31日,OFweek2018中国(上海)国际人工智能展览会在上海跨国采购会展中心盛大举行,AI+文娱独角兽企业极链科技Video++受邀参展,并携最新AI技术成果亮相展会. 智搜(Gi ...

  2. 2019 Google物体挑战赛结果正式揭晓 极链科技获得金牌

    近日,由Google主办的2019 Google物体挑战赛结果正式揭晓,首次参赛的极链科技AI团队在仅剩两个月的时间下赢得一枚金牌. 去年,在MS COCO停止举办物体边框识别的比赛后,Google发 ...

  3. AI文娱独角兽Video++极链科技完成C1轮,5个月融资10.7亿元

    消息,近日获悉,AI文娱独角兽Video++极链科技完成C1轮,近5个月融资10.7亿元,新晋投资方包括优必选科技天狼星资本.新华文轩与新浪的基金文轩资本.瑞力投资.汉富控股等. 本轮融资之后,Vid ...

  4. 极链科技联合阿里云发布视联网平台解决方案

    9月25日至27日,2019云栖大会如期召开.作为国内互联网界的顶尖会议,云栖大会一直备受业界关注.在大会的最后一天,阿里云智能视频分论坛为今年的云栖大会献上了一场精彩的压轴好戏,首次对外发布视频云V ...

  5. Deepsort_V2 2020中兴捧月阿尔法赛道多目标检测和跟踪初赛第一名

    2020中兴捧月阿尔法赛道多目标检测和跟踪初赛第一名方案 初赛:多目标跟踪:指标MOTA和MOTP, 后期的大量实验证明检测算法相对于跟踪更重要. 数据集分析: 1.人群密集稀疏场景: 2.场景(白天 ...

  6. 互联网快讯:SpaceX星链正测试为飞机提供宽带;极米科技高性能产品获好评;雷蛇宣布将从港交所退市

    国内要闻 圆通速递签约成为杭州2022年亚残运会官方物流服务赞助商: 网易云音乐正式登陆港交所:上市首日破发跌2.49%,市值415.31亿港元: 3.深入下沉市场"掘金",土巴兔 ...

  7. 互联网快讯:极米科技高性能产品获好评;中国物流集团成立;江西中小学将新增游泳课

    国内要闻 青春痘疫苗预计2023年进入临床应用,成年人也能接种: 国家统计局:全年粮食产量连续7年保持在1.3万亿斤以上: 3.辽宁阜新对主动进行核酸检测结果阳性人员奖励2万元: 4.山西寿阳明泰电厂 ...

  8. 极智AI | 目标检测实现分享二:听说克莱今天复出了?详解 YOLOv2 算法与克莱检测

      欢迎关注我的公众号 [极智视界],回复001获取Google编程规范   O_o   >_<   o_O   O_o   ~_~   o_O   大家好,我是极智视界,本文介绍一下克莱 ...

  9. 互联网快讯:谷歌重启可穿戴设备业务;极米科技高性能产品获好评;鸿蒙Harmony OS系统明年将正式登陆欧洲

    国内要闻 网宿科技拟斥7500万元参设产业基金,投资云计算与边缘计算等领域: 华为:鸿蒙Harmony OS系统明年将正式登陆欧洲: 3.启明星辰DT总部落地杭州,发布数据安全整体框架"数据 ...

最新文章

  1. 如何避免重构带来的危险
  2. 重新认识vue之事件阻止冒泡
  3. vue-i18n国际化实例
  4. 淘宝内部分享:怎么跳出MySQL的10个大坑
  5. 模拟http中需要注意到的headers字段
  6. 渲染性能测试 , 结果比想象中好很多.
  7. oracle export命令使用浅解,Oracle Export命令使用浅解
  8. array用法 numpy_python--numpy(3)
  9. Async Python 竟不比sync Python 快,怎么回事?
  10. 17-05-25模拟赛
  11. 2020Java程序设计基础(华东交通大学)章节测试免费满分答案
  12. 北大美女辞去公司副总职务创业养狗
  13. viper4android顶级脉冲,ViPer4android. FX顶级音效!
  14. IDEA新版UI申请方法+无测试资格使用方法及相关介绍
  15. 并行计算范式-SIMD vs SIMT vs SMT: What’s the Difference Between Parallel Processing Models?
  16. 笔记:腾讯云服务器的使用
  17. win2003 启动报错c0000135 this application has failed to start because csrsrv.dll was not found
  18. android5.0新特性 clipping的用法
  19. linux内核动态logo图片,kernel LOGO修改
  20. 微信小程序真机调试报错{“errMsg“:“hideLoading:fail:toast can‘t be found“}

热门文章

  1. Array Nesting 问题及解法
  2. linux设备树笔记__基于msm8x10的基本分析
  3. 「Python条件结构」if…elif…else身份证长度校验
  4. IDEA教程之Changelist
  5. jq 选择器 选中某元素和反选
  6. android studio svn清除,Android Studio SVN 无法提交删除
  7. 计算机图形学考试题及答案_《计算机图形学》模拟试题答案
  8. PMP备考系列:139个工具和技术和关系图
  9. 苹果电脑Mac-M1-芯片已经支持适配-PS-,2021安装 M1芯片处理器安装PS2021 完美版
  10. 【VUE前进之路】插槽的使用