雷刚 发自 凹非寺 
量子位 报道 | 公众号 QbitAI

中国科学院,国家科学科研重器。

现在,同样也是中国AI创新创业重镇。

继寒武纪、银河水滴、中科视拓、中科慧眼等AI公司后,又一家“中科院系”AI初创公司浮出水面。

这家公司全名中科视语(北京)科技有限公司,源自中科院自动化研究所模式识别国家重点实验室,是主打步态识别、多模态识别的银河水滴的“胞弟”。

名如其司,一样主打AI视觉赛道。

而且中科视语“初出”江湖便出手不凡。本月内,先与影谱科技联手斩获2018吴文俊人工智科技进步二等奖。

最近又在刚落幕的“AI Challenger 2018全球AI挑战赛”年度总决赛中,拿下无人驾驶视觉感知赛道冠军。

而且夺冠成绩领先第二名4倍之多,得到“达到世界级领先水平”的评价。

这就是一家怎样背景的公司?

中科视语

“AI Challenger 全球AI挑战赛”,想必中国AI领域内已不必赘述。

今年由创新工场、搜狗、美团、美图等联合发起,不仅出钱出力,而且分享数据。

虽才第二届,但已是国内规模最大的、最关注前沿科研与产业实践相结合的非商业化数据集和竞赛平台。

本次大赛吸引了来自81个国家的1100所高校和990家公司的上万支团队参赛,中科视语团队,正从上万支团队中脱颖而出。

其带队者,亦是公司董事长,乃中科院自动化所研究员王金桥博士。

王金桥2004年硕士毕业于天津大学,当年进入中科院自动化所攻读博士学位,2008年博士毕业后留校,并在2016年正式成为中科院自动化所研究员。

其间,2011年,王金桥还以“铸星计划”青年访问学者身份“加入”微软亚洲研究院。

AI视觉领域也是王金桥强项所在。其履历所系,一直从事视频分析与检索、目标检测与跟踪、图像分类与识别方面的应用基础研究。

同时也涉及模式识别与机器学习方面的相关理论研究,围绕大规模视觉识别和视频大数据分析成立了智能媒体计算联合实验和视频大数据云识别联合实验。

而代表科研能力的论文方面,王金桥主页显示,共发表论200余篇,国际杂志36篇,国际会议160余篇。其中以第一作者或通讯作者发表高水平国际期刊论文30篇。

这也是中科视语创办的缩影之一。

虽然创立时间不长,但团队人员及背靠中科院自动化所的积累,却已有20年历史,而AI领域,中科院自动化所更是有“全球第七、中国第一”的夸赞。

在过去科研中,中科视语团队将AI技术,核心在公安、交通、娱乐、零售和工业等各个垂直领域进行了广泛的技术验证和应用,并宣称已经具有上百家上市公司、政府和行业客户,包括杰创、联想、京东、华为、影谱、京东方等多家上市公司,拥有坚实的数据、理论、算法和用户基础。

而正式创办中科视语后,聚焦智慧交通、智能商业和智能制造等三大领域,提供AI引擎和解决方案。

并获得了中科院产业基金和金沙江创投的首轮投资。

AIC夺冠策略分享

当然,此次AI Challenger夺冠后,中科视语团队也分享了个中经验。

我们原文转载如下:

以无人驾驶视觉感知为例,需要同时解决“目标检测”和“可行驶区域分割”两个子问题。

而由于计算资源有限,为了追求精度和速度的平衡,算法设计需要考虑多任务学习框架。

接下来,需要深入剖析子问题的难点,对算法各个模块进行定制化设计。

比如对于目标检测来说,该应用场景需要尽量提高各类目标的检出率,所以小目标检测就成为难点,这里的小目标包括交通标志、交通灯、远处的行人和车辆等。

对于可行驶区域分割来说,主要难点在于类间定义模糊,即可直接行驶区域和可间接行驶区域之间有时候界限并不是很清晰。

本质上可行驶区域就是道路,但是对于双车道来说另一侧车道就是背景了,所以对于可行驶区域分割来说需要算法具有较强的上下文语义感知能力。

基于上述分析,视语团队提出了一种多任务耦合神经网络的解决方案。

具体来说,针对速度方面的要求,从三方面进行优化:

  • 第一是多任务学习,一个网络同时处理检测和分割两个任务,使它们尽可能多地共享耦合特征计算;

  • 第二是设计轻量级的多尺度耦合网络,降低网络本身的计算量,并进一步裁剪预测头;

  • 第三是代码优化,包括batch输入、GPU解码、CPU解码+流水处理等。

考虑到解码部分耗时较高,团队将图片解码放到GPU上进行实现,以充分利用GPU的并发性来加速解码。

同时形成前处理(CPU)、网络前向(GPU)以及后处理(CPU)的流水式操作,用网络前向的时间掩盖CPU读图和写图的时间。

为了有效提升模型的精度,团队采用了三种有效的策略:

  • 第一是使用特征金字塔,主要是改善小目标检测精度;

  • 第二是使用空间金字塔池化ASPP模块,主要是增强网络的上下文语义感知能力;

  • 第三是引入数据蒸馏,进一步优化轻量级网络的性能。

基于上述策略,团队提出了一个面向多任务的耦合神经网络(MCoupleNet),能够同时处理目标检测和可行驶区域分割两个任务。

整个网络包含了5个模块:基础网络、ASPP、特征金字塔、检测分支以及分割分支。基础网络部分是团队自主设计的轻量级网络Inception-56,基础网络和特征金字塔之间通过ASPP模块连接在一起,ASPP模块由一系列采用不同膨胀系数的卷积层组合,可以同时捕捉多种上下文信息,并加入深层监督来引导整个学习过程。

特征金字塔的设计可以参考团队在ACCV16发表的工作以及Facebook发表于 CVPR17的论文。

ACCV16的论文主要用来处理监控场景下不同尺度的行人,通过自适应的上采样模块在不同分辨率的特征图上处理不同尺度的行人目标,Facebook CVPR17的论文进一步引入lateral connections并且推广到通用目标检测上,是目前比较成熟的解决目标多尺度的算法。

团队在此基础上加入基本的检测分支和分割分支,从而组成一个多任务的学习框架。

轻量级耦合网络主要包含两个模块:基本的下采样模块和简化版的残差Inception模块。

基本的下采样模块主要应用在网络的早期,用来快速下采样从而减少计算量,同时改善特征表达能力。简化版的残差Inception模块使用了更少的通道数,在每次下采样的时候通过两个1x1的维度扩充卷积、动态的增加一倍的通道数,用来补偿空间分辨率损失。

不同于MobileNet和ShuffleNet,该轻量级网络中所有的卷积都是常规卷积,没有group卷积和depthwise卷积,因此能够适用于所有的平台,并且有助于减少MAC(memory access cost),同时所有的卷积后边紧跟着BN和ReLu,最终网络的计算量只有143M。

除了基础网络之外,对新加入的特征金字塔也需要进一步的调整。尤其是高分辨率输入下,算法的各个部分都有可能成为计算瓶颈。

以720P输入为例,特征金字塔部分的通道数默认为256,网络上采样的倍率为4,对于特征金字塔中的一个3x3的卷积层,其计算量#FLOPS=33256256184*320=34.7G,非常大!

所以特征金字塔部分也需要进行裁剪,并且对输入分辨率和上采样倍率之间也需要进行权衡。

最终,团队凭借上述原创的算法设计方案,在2018全球AI挑战赛无人驾驶视觉感知赛道中取得了性能的遥遥领先。

年度评选报名

加入社群

量子位AI社群开始招募啦,欢迎对AI感兴趣的同学,在量子位公众号(QbitAI)对话界面回复关键字“交流群”,获取入群方式;

此外,量子位专业细分群(自动驾驶、CV、NLP、机器学习等)正在招募,面向正在从事相关领域的工程师及研究人员。

进专业群请在量子位公众号(QbitAI)对话界面回复关键字“专业群”,获取入群方式。(专业群审核较严,敬请谅解)

诚挚招聘

量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

喜欢就点「好看」吧 !

又一中科院AI创业公司浮出水面,刚拿下AIC挑战赛视觉感知冠军相关推荐

  1. 王小川新AI公司浮出水面:成立「五季智能」,召集搜狗旧部,水下估值接近独角兽...

    鱼羊 发自 凹非寺 量子位 | 公众号 QbitAI 前搜狗CEO王小川的AI新公司,正式浮出水面. 公司名为五季智能. 企查查信息显示,公司股东为王小川和茹立云. 后者是王小川的老朋友,在搜狗创业初 ...

  2. 又一北大系AI公司浮出水面,百炼智能宣布获千万元天使投资

    郭一璞 发自 北大隔壁  量子位 报道 | 公众号 QbitAI 5月4日,是≤28岁er可以放假半天的日子,也是北大校庆. 2018年的这一天,北大120周年校庆之际,北大系AI公司百炼智能也决定正 ...

  3. 再提“鸿蒙”,任正非说这是为物联网而生;硅谷公司年薪报告出炉,谷歌年薪居榜首;苹果CEO库克接班人浮出水面,苹果高层或大换血?...

    关注并标星星CSDN云计算 极客头条:速递.最新.绝对有料.这里有企业新动.这里有业界要闻,打起十二分精神,紧跟fashion你可以的! 每周三次,打卡即read 更快.更全了解泛云圈精彩news g ...

  4. 金蝶品牌新战略浮出水面丨IBM助力数字货币走向成熟 【软件网每日新闻播报│第10-16期】

    每一个企业级的人 都置顶了 中国软件网 中国软件网 为你带来最新鲜的行业干货   小编点评 过度解读 08年上海高考语文卷阅读题,家乡的女人把丈夫叫"汉子",曾祖母却这样叫&quo ...

  5. 西卡 你要浮出水面啦

    以前你好帅啊,现在没感觉了.你长大了,我也长大了 你浮出水面了,对不起!

  6. 鸿蒙内部测试情况,鸿蒙OS内测曝光,安卓劲敌浮出水面!

    原标题:鸿蒙OS内测曝光,安卓劲敌浮出水面! 在手机操作系统领域,一直是苹果的IOS和谷歌的Android两家独大,而随着华为鸿蒙OS的出现,这一现状或被打破.此前,国人一直期待鸿蒙OS有更新的进展. ...

  7. A 股 30 年终迎教育公司 IPO,“旧金山”投资人浮出水面

    作者 | 任雪芸 责编 | 潘心怡 出处 | 36氪Pro 在传智教育上市前,A股没有一家直接IPO的教育企业. 这个聚焦于成人 IT 培训赛道的机构,在进入二级市场之前,也不像一众 K12 培训企业 ...

  8. 2019年中国社交电商行业市场分析:社交电商巨头已浮出水面

    什么是社交电商? 社交电商是基于社交媒介功能,建立在社交关系基础上,通过社交活动.内容分享等方式低成本获取流量,最终实现商业变现的创新型电商模式.随着传统电商平台运营成本不断上涨,流量红利消逝,&qu ...

  9. “联通云”正式浮出水面 要讲出云计算怎样的“新故事”?

    科技云报道原创. 如今的云计算就像水一样,无声无形却与各行业融为一体,成为无处不在的基础设施.虽然在外界看来,云计算市场格局已经尘埃落定,头部云厂商呈现出马太效应,但在算网融合以及未来网络新技术趋势下 ...

最新文章

  1. #第六次会议#(4.21)
  2. [Step By Step]SAP HANA中使用Excel展示分析视图数据(带层次结构)
  3. 如何在客户端发送ajax请求,ajax - 从服务器(nodejs)发送数据到客户端(ajax请求)
  4. mysql查询特定时间数据视频_mysql查询特定时间段内的数据
  5. [Spark]PySpark入门学习教程---RDD介绍(2)
  6. matlab如何解不等式,如何用MATLAB求解不等式组的所有可能解
  7. 阿里云Kubernetes服务上使用Tekton完成应用发布初体验
  8. linux apache php显示源码,linux 源码安装apache PHP 问题
  9. python3和php7哪个好_性能是Flask的3倍!比PHP7还快!这个Python框架你值得拥有!
  10. OpenCV4每日一练day3:运行OpenCV示例程序(物体跟踪)
  11. 【Linux】【Commands】文本查看类
  12. 文学系列:《红与黑》读书笔记
  13. 基于Java的webapp_第一个 JAVA WEB 应用
  14. 洛谷每日三题之第六天
  15. C# 用户自定义控件添加到工具箱
  16. 多开分身苹果版_苹果手机最新微信分身怎么下载?微信多开地址分享
  17. usleep java_usleep是否创建了线程取消点?
  18. 今天开始正式认认真真学习Python,以上!
  19. ubuntu 桌面任务栏不见解决方案
  20. 内是不是半包围结构_如何区分半包围结构的字?

热门文章

  1. 程序员版《On Call 24 小时》
  2. 滴滴配合警方调证不超 10 分钟;苹果否认恶意芯片报道;贝索斯建火箭中心 | 极客头条...
  3. Oracle 抢人了!近 4000 万年薪只为一个 AI 专家
  4. Android 违规使用 Java,谷歌或面临 88 亿美元赔款
  5. 想搞定大厂面试官?4面阿里拿到P7Offer通用流行框架大全
  6. 饥荒机器人怎么用避雷针充电_饥荒避雷针有什么用
  7. linux删除几日的文件脚本,Windows Linux 删除N天之前文件脚本
  8. turtlebot3 模型没有显示_Turtlebot3新手教程:Open-Manipulator机械臂
  9. 两栏布局的5中实现方式
  10. mysql数据库编程(c 语言)_【C/C++学院】(23)Mysql数据库编程--C语言编程实现mysql客户端...