李根 发自 Palo Alto 
量子位 报道 | 公众号 QbitAI

阿里AI又有什么新进展?

近日,在全球权威机器视觉算法排行榜KITTI刷新了排名,阿里巴巴人工智能研究机构iDST夺得行人检测单项冠军。

与此同时,在知名的行人再识别数据集Market1501中,他们也取得重大突破,首位命中率提升至96.17%,位居世界第一。

行人检测、行人再识别是交通管理、城市平安、无人驾驶等领域的两项核心基础技术。

行人检测要求机器能够从图像或者视频中判断是否有行人,行人在哪里;行人再识别则要求机器能够识别出特定人员的所有图像。

在景区商场人流预测、人群个性化分析、行人交通安全、无人驾驶、寻找丢失老人儿童等应用上,这两项技术可以发挥巨大的作用。

 阿里巴巴iDST副院长、IEEE Fellow华先胜

“这并非简单的人脸识别。”阿里巴巴iDST副院长、IEEE Fellow华先胜说,在实际的城市场景下,大多数摄像头拍摄到的图像看不清人脸,但通过行人的整体和局部特征则可实现人员的识别。

然而,实际场景中遮挡、光照、拍摄角度、拍摄距离、人物姿态等因素的变化,以及摄像头设备的不同,对行人检测和行人再识别的准确性会提出极大挑战。

具体解决方案上,华先胜领导的机器视觉团队采用了以下几项技术创新:

行人检测技术方面,提出了基于目标尺寸分级的级联检测网络,并基于动态投票和循环推断的边界框定位策略,重点解决行人检测问题中存在的目标尺寸浮动大、语义特征差异大、遮挡、形变且定位不准等问题。

针对小尺寸目标的检测,利用了面向不同目标尺寸级别的多分支网络结构,充分发挥感兴趣区域的上下文信息提升网络特征提取的能力,同时在目标定位的问题中采用交叉熵正则约束来优化边框定位准确度。

行人再识别方面,提出了基于局部细粒度信息和全局粗粒度信息相结合的识别网络,并引入了不同摄像头下特征表达一致性的约束,用于多摄像头下的行人再识别任务。

网络结构设计上,利用超分辨模块和特定的人头、上半身和下半身注意力网络和识别网络来得到更清晰的局部细节特征,解决行人全局特征中存在的尺寸影响大、清晰度低等问题,引入全局特征和局部特征的动态融合机制解决局部遮挡问题。同时,采用距离正则约束来提高跨摄像头下行人表征的一致性。

除了行人检测、行人识别之外,iDST还长期占据着KITTI的车辆检测世界冠军,并在计算机视觉国际顶级会议TIP、ACM MM等发表了多篇论文。

阿里方面表示,目前这些技术已经全部集成到阿里云ET城市大脑当中,并在多地落地使用。

华先胜说,“正如60年代的登月计划带来了通讯技术、生物工程技术大爆发一样,城市大脑已经成为世界顶尖的科技创新的平台,前所未有的难题倒逼科学家们创造前所未有的技术”。

此前不久,城市大脑还正式成为国家四大人工智能开放创新平台之一,未来将吸引全球顶尖的研究机构共同参与创新。当前阿里云ET城市大脑已经在杭州、苏州、衢州、乌镇等地落地。

不过阿里并未提及自动驾驶方面的应用和进展,行人检测、行人再识别在自动驾驶的重要性不言自明。此前还有机器视觉公司凭借KITTI夺冠来证明自己的无人车研发实力,就是现在无人货车领域大热的图森未来。

但在国内外巨头纷纷加码自动驾驶的喧嚣里,阿里始终没有透露无人车领域的野心。

对于机器视觉倒是十分重视,内部研发自不必言,外部投资方面,阿里集团旗下的蚂蚁金服投资了旷视科技,而阿里集团之前还传出了15亿元投资商汤科技的消息。

加入社群

量子位AI社群13群开始招募啦,欢迎对AI感兴趣的同学,加小助手微信qbitbot5入群;

此外,量子位专业细分群(自动驾驶、CV、NLP、机器学习等)正在招募,面向正在从事相关领域的工程师及研究人员。

进群请加小助手微信号qbitbot5,并务必备注相应群的关键词~通过审核后我们将邀请进群。(专业群审核较严,敬请谅解)

诚挚招聘

量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。


量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态


阿里AI两项技术刷新行业纪录,为城市大脑,OR也为无人车?相关推荐

  1. Brightcove喜获两项技术与工程艾美奖

    视频行业领先企业因对行业做出的基础性贡献和技术上的持续创新而获奖 波士顿--(美国商业资讯)--全球商业视频行业领先企业Brightcove Inc. (NASDAQ:BCOV)今天宣布,公司获得由美 ...

  2. 腾讯云连续四年登上KVM开源贡献榜,两项技术获评年度核心突破

    36氪获悉,在全球虚拟化顶级技术峰会KVM Forum上,2020年全球企业KVM开源贡献榜正式公布.腾讯云连续四年登上该榜单.腾讯云贡献的两项技术方案被评为KVM2020年度核心突破.截至目前,腾讯 ...

  3. 阿里王坚回答的这三个问题 把城市大脑和人工智能说透了

    阿里王坚回答的这三个问题 把城市大脑和人工智能说透了 infoQ旗下的<二叉树>采访了阿里巴巴集团技术委员会主席王坚. 王坚,阿里云的创始人,ET城市大脑的发起人.他被认为是当下最有思辨性 ...

  4. 转行 AI 成为技术大牛,你需要理解这两项技术!

    2019 年 5 月 26 - 27 日,由中国 IT 社区 CSDN 与数字经济人才发展中心联合主办的第一届 CTA 核心技术及应用峰会将在杭州国际博览中心召开.近 500 名开发者将齐聚于此,共同 ...

  5. CVPR专访阿里iDST华先胜:电商搜索与城市大脑,本质上都是视觉系统问题|CVPR 2017...

    雷锋网 AI 科技评论按:在 CVPR 2017 ,雷锋网(公众号:雷锋网) AI 科技评论看到了非常多的工业界人士来到现场.这个计算机视觉领域的学术会议吸引了如此多的企业研究院大牛,他们对工业界与学 ...

  6. 混凝土地坪机器人_创新引领 快速建造丨临时设施大项目部使用机器人等五项技术刷新建设新效率...

    为响应公司快速建造的理念 公司临时设施大项目部积极开拓创新 运用地螺丝基础 折叠集装箱 钢格栅地面 激光地面整平机器人 地面磨光机器人 提高建造速度 降低施工成本 并实现了可周转化 01 地螺丝基础 ...

  7. 一个月内取得多项技术进展,详解阿里AI背后的故事

    (图片来源:全景视觉) 经济观察网 记者 陈秋技术价值的最终体现,无非是从它能否带来经济社会生活的改变,能否带来商业化场景大规模落地.而在人工智能领域,技术应用的商业化也是衡量其价值的唯一标准. 在过 ...

  8. 腾讯优图×厦大联队夺冠全球AI医疗大赛!刷新肝脏肿瘤影像分割世界纪录

    李根 假装发自 Amoy  量子位 报道 | 公众号 QbitAI 中国团队又在全球AI大赛中大放异彩. 近日,全球LiTS (Liver Tumor Segmentation Challenge,肝 ...

  9. 载誉前行 创新发展 | 拓保软件三项技术获评“深圳企业创新纪录”

    近期,第十九届"深圳企业创新纪录"评选结果出炉,审定通过129家企业的177个项目为第十九届"深圳企业创新纪录".其中,深圳市拓保软件有限公司的两项技术被审定为 ...

最新文章

  1. java底层语言_JAVA语言思维的底层基础
  2. CHECKLIST TO USE BEFORE SUBMITTING A PAPER TO A JOURNAL
  3. 【转】Ubuntu 16.04 远程桌面
  4. cmd命令不识别exp_cmd 命令行exp 命令导出数据库文件
  5. visual odometry andmultiple view setting
  6. 【springBoot】springBoot返回json的一个问题
  7. 29. Element ownerDocument 属性
  8. T-SQL数据类型的细微差别(四)
  9. 用laravel开发php,使用 PhpStorm开发Laravel项目
  10. iptables应用
  11. VUE项目中使用阿里图标iconfont
  12. SpringSecurity实现登陆认证并返回token
  13. 只因写了一段爬虫,公司200多人被抓!
  14. 92.发光文字加载特效
  15. 大内高手 内存管理器
  16. Go语言核心之美 1.2-变量及声明篇
  17. oswatch的安装和使用
  18. 处理autocad 2010闪退
  19. Node.js文档和教程
  20. StarRocks 运维工具 StarGo

热门文章

  1. 福利 | 2018 年,程序员全新的技术之路
  2. 网络编程函数小总结与初识socket
  3. php post u,php 超全局变量 get post request
  4. 高并发热点/单点数据_性能问题解决方案
  5. python人脸识别库_基于facenet的实时人脸识别系统
  6. linux 的一些实用工具,linux 命令行下的一些实用工具
  7. python模拟浏览器下载文件_模拟浏览器下载文件?
  8. psychopy 音频时长代码_多媒体之音频输入1
  9. 计算机系统的输入与输出接口是,计算机输入输出系统与接口技术
  10. atlas mysql怎么连接_Atlas安装配置教程 Atlas怎么安装配置