雷锋网 AI 科技评论按:在 CVPR 2017 ,雷锋网(公众号:雷锋网) AI 科技评论看到了非常多的工业界人士来到现场。这个计算机视觉领域的学术会议吸引了如此多的企业研究院大牛,他们对工业界与学术界的融合有何看法?又是如何理解自家业务在视觉领域的地位和创新点的?为此,雷锋网 AI 科技评论与阿里 iDST 视觉计算组负责人华先胜在 CVPR 的现场进行了一次交流。

CVPR专访阿里iDST华先胜:电商搜索与城市大脑,本质上都是视觉系统问题|CVPR 2017

华先胜,北京大学应用数学博士、IEEE Fellow、ACM 2015 年度杰出科学家、MIT TR 全球 35 位 35 岁以下的杰出青年创新人物,曾担任 ACM Multimedia 等大会程序委员会主席,是视觉识别和搜索领域的国际级权威学者。于 2016 年 7 月加入阿里人工智能研究机构iDST科学家团队,带领视觉计算团队的研发工作。

华先胜认为,CVPR 这个会议整体上还是非常成功的。计算机视觉领域的研究大多倾向于实用,与工业界的联系也比较紧密,企业参与到学术会议中,实际上也能了解学术研究的整体发展状况。就像 SIGGRAPH 一样,当工业界的参与程度非常高的时候,这个会议也变得越来越红火。「这类会议成功与否的一个重要标准在于,它能不能对工业界产生影响力。如果只是学术圈自己在推进,这个领域可能会变得越来越封闭。」

雷锋网 AI 科技评论也发现,不论是赞助商日趋增加的 AAAI 2017,或是应用研究开始崭露头角的 ACM 计算经济学会议,与工业界的融合和沟通已经越来越频繁,而尤其是在计算机视觉这个领域,学术界和工业界的界限也变得模糊起来,很多文章可能都是高校与企业研究院一同合作的课题。

以本次被 CVPR 录用的论文《Video2Shop: Exact Matching Clothes in Videos to Online Shopping Images》为例,第一作者是西南交通大学的博士生程治淇,他在阿里实习期间与视觉计算组负责人华先胜、高级算法专家刘扬及他的导师、西南交通大学的吴晓教授合作完成了这一论文。论文提出了一个名为 AsymNet 的深度神经网络,通过学习衣物序列特征并对其进行编码,能够检测并追踪衣物,用户在观看视频的时候,便可以轻松地选购明星同款服装。

这一研究自然是着眼于阿里的老本行——电商领域,华先胜最初的工作也一直关注的是像「拍立淘」这样的产品系统。而目前,华先胜作为阿里 iDST 视觉计算组的负责人,目前所负责的城市大脑项目,也同样有着视觉的需求。

在本次 CVPR 的 workshop 环节,华先胜作为 Target Re-Identification and Multi-Target Multi-Camera Tracking 的特邀演讲嘉宾之一,发表了《Practices of Large-Scale Target Re-Identification》的演讲。

华先胜告诉雷锋网 AI 科技评论,这一主题和电商的商品搜索及城市大脑项目都有着紧密的联系,因此将阿里整个集团与目标重识别的业务综合地做了一个介绍。搜索(search)的范围相对宽泛一些,只需要找到符合要求的内容,甚至是相似的内容就可以了,比如以图搜图,可能会有很多相近的结果;而重新识别(Re-Identification)则需要精准匹配,比如在整个城市里找到某辆车,目标就非常明确了(只有一个)。不过,商品的搜索与城市大脑项目所涉及到的几个关键步骤是很相似的,本质上也就是做一个视觉搜索系统(visual search system)。「这与拍立淘的系统其实是很像的,只不过关键点的差别是在 feature 上。对于电商而言,要找的就是同一个商品或是相似的商品;而对于城市大脑的话,我们目前要找的主要集中于三种对象:车、人,和骑车的人。」

阿里从淘宝起家,后来也投身支付宝和菜鸟的业务,但实际上并没有跳脱出电商的本质。目前,城市大脑项目组的推行,则让很多人看到了阿里的另一个野心:云计算。「阿里推行城市大脑项目最关键的地方在于,希望能通过大计算去挖掘大数据背后的价值。」华先胜告诉雷锋网 AI 科技评论,不论是交通或是安全,城市是一个非常大的数据载体,或者说是聚合体。包括视频信号、GPS 信号、微波信号等多种类型的数据每天都在积累,但其中的价值还远远没有充分挖掘出来。「阿里城市大脑中很关键的一个任务就是要解决视觉信号的问题,这实际上是对城市的智能感知。」

城市在没有摄像头的时候,一开始可以说是处于一个「无感无知」的情况;后来城市里有了摄像头,但缺乏这些数据的分析和研究,这个状态就是所谓的「感而不知」;而在海康威视、大华为代表的公司在摄像端算法上发力,逐渐往「感而略知」发展;如今以阿里等企业牵头所做的城市大脑项目,则是希望做到「感而全知」。

「全面知、全局知、全时知,」华先胜以这三个词概括了城市大脑的主要特点。全面知指的是除了车和车牌之外,我们可以了解城市中包括人与非机动车的一些情况;全局知指的是整个系统有强大的计算能力,得以从多个方面宏观了解城市的情况;全时知则是实时、及时地把握城市在交通、安全等方面的情况。

此前华先胜在接受雷锋网采访的时候也提及,自己并不认可企业只关注算法的商业模式,「城市大脑项目的推进得益于强大的计算能力和 AI 技术的发展,阿里在做的其实是一个平台、一个生态,欢迎各个企业也能够加入其中,这样一来,数据的价值也能更好地体现。」

而在 CVPR 2017 交流期间,华先胜也了解到,比起学术界,工业界能接触到的数据量确实有着质的差距。「我昨天看到一个 poster,用了大概 20 个摄像头、上百个人的数据,就算得上是大数据的研究了(large-scale),但阿里在算法研发中自测数据集基本上是上千个摄像头,上万个人的体量,这个数字在学术界可能是无法想象的。」不过,华先胜也指出了工业界的上线压力和快节奏的特点,这也常常导致很多研究难以做得更加深入,需要学术界的自由度和前瞻性来弥补。

华先胜也告诉雷锋网 AI 科技评论,他在参会时感受一个明显的需求,就是提升深度学习 inference 的计算效率。不管是 embedded device 上的需求,还是云上大规模计算的场景,如何降低计算成本成为了一个热点。「以阿里巴巴的城市大脑项目为例,需要处理的数据量非常大,从成本的角度出发,对效率也提出了更高的要求。阿里 iDST 同样在做相关的优化工作,也希望从本次 CVPR 上获取一些效率提升的研究灵感。

此外,阿里这次来到 CVPR 现场,同样有着不小的招人需求。正像雷锋网 AI 科技评论在此前报道中所提及的,本次的赞助商达到了 127 家,总赞助费超过 85.9 万美金。与其他工业界展商一样,阿里一方面是为了介绍自己的研究成果,另一方面也着眼于在人才济济的学术会议上招揽优秀的老师和同学们加入阿里 iDST 。我们也期待,阿里 iDST 在未来能够给我们带来更多的城市大脑应用,将数据的价值体现得淋漓尽致。

本文作者:奕欣

本文转自雷锋网禁止二次转载,原文链接

CVPR专访阿里iDST华先胜:电商搜索与城市大脑,本质上都是视觉系统问题|CVPR 2017...相关推荐

  1. 专访阿里iDST华先胜:CV行业遍地黄金,只可惜创业者都去红海厮杀,却忽视了蓝海...

    虽然从学术和研究氛围浓厚的微软亚洲研究院出身,且获得过微软多项重大技术突破创新奖,但华先胜心里很清楚,算法在商业化落地中所扮演的角色并不是核心要素. "算法在高手之间的差异其实很小,壁垒的形 ...

  2. 阿里研究员华先胜:图像搜索的前世今生

    摘要让你买买买停不下来的淘宝是如何做到所拍即所得的? 以下内容为由4月27日由将门主办的"计算机视觉"主题技术专家微信群分享嘉宾实录. 自我介绍 我在2001年北大数学系十年寒窗博 ...

  3. 阿里iDST研究员华先胜:图像搜索的下一步是可以索引整个城市

    导读:阿里的"刷鞋购物"在国内外引发众多关注,其背后支撑的技术正是来自阿里iDST华先胜团队图像搜索技术的运用. 近日,计算机图像视觉顶级会议CVPR 2017在美国夏威夷举办, ...

  4. 专访iDST华先胜:城市大脑_对城市的全量、实时认知和搜索

    原文地址 编者按:10月11-14日,为期四天的2017杭州云栖大会(门票火热抢购中!)将再度在杭州云栖小镇起航,作为全球最具影响力的科技展会之一,本届大会将有不少阿里集团专家以及各企业行业领袖的精彩 ...

  5. 专访iDST华先胜:城市大脑,对城市的全量、实时认知和搜索

    编者按:10月11-14日,为期四天的2017杭州云栖大会(门票火热抢购中!)将再度在杭州云栖小镇起航,作为全球最具影响力的科技展会之一,本届大会将有不少阿里集团专家以及各企业行业领袖的精彩演讲.第一 ...

  6. 专访阿里 iDST 语音组总监鄢志杰:智能语音交互从技术到产品,有哪些坑和细节要注意?

     专访阿里 iDST 语音组总监鄢志杰:智能语音交互从技术到产品,有哪些坑和细节要注意? 雷锋网按:在外界看来,阿里 iDST 是一个神秘的部门,大家知道里面聚集了很多技术大牛,但是对这个部门真正 ...

  7. 阿里重投内容电商,VR技术会成为马云的杀手锏吗?

    阿里重投内容电商,VR技术会成为马云的杀手锏吗? 在天猫双11的媒体中心,给全球600多家媒体留下最深刻印象的除了1207亿这个数字之外,还有每个人桌面摆放的HTC Vive定制的VR头盔,通过VR头 ...

  8. 阿里云技术专家解读 | 行业首创电商搜索模板

    讲师:徐希杰–阿里巴巴技术专家 视频地址:https://developer.aliyun.com/live/246673 电商行业模板介绍:https://www.aliyun.com/page-s ...

  9. 基于机器学习的阿里智能助理在电商领域的架构构建与实践-CSDN公开课-专题视频课程...

    基于机器学习的阿里智能助理在电商领域的架构构建与实践-2904人已学习 课程介绍         在全球人工智能领域不断发展的今天,包括Google.Facebook.Microsoft.Amazon ...

最新文章

  1. C#一个事件中调用另一个事件
  2. 中国工程院2021年院士增选第二轮候选人名单公布
  3. frame,iframe,frameset用法和区别
  4. shell中定义变量用双引号和单引号以及不用引号的区别
  5. MariaDB(MySQL)数据库的介绍及使用示例
  6. MarkDown语言
  7. java字符流和字节流的区别_java字符流与字节流的区别是什么
  8. phpcms文件夹plugin调用怎么写路径 - 代码篇
  9. 每日英语--Week6
  10. [转载]关于太阳(卫星)天顶角,太阳高度角,太阳方位角的整理_akala啦_新浪博客...
  11. ReactNative实现仿微信或者通讯录快速索引功能
  12. org.postgresql.util.PSQLException: ERROR: column loginid of relation userinfo does not exist
  13. mongodb 服务器时区设置_关于MongoDB时区问题
  14. Dem与遥感影像制作三维效果简单教程
  15. 汉客儿2019支付宝加密红包设计思路
  16. 解决谷歌浏览器你的时钟快了和证书问题
  17. 基于瑞芯微平台cif接口dvp相机的视频接入(ov2640、rv1126为例)
  18. Adobe illustrator 输入数学平方公式
  19. bzoj1202 狡猾的商人[并查集]
  20. linux复制jar文件,linux如何将界面上的一个JAR文件拷贝到ROOT下啊

热门文章

  1. JAVA关于设计模式六大设计原则
  2. 8月5日到9月2日工作总结
  3. Canal配置connector.subscribe和canal.instance.filter.regex遇到的坑
  4. 面试突击37:线程安全问题的解决方案有哪些?
  5. JMETER压力测试报错:JAVA.NET.BINDEXCEPTION: ADDRESS ALREADY IN USE: CONNECT
  6. 新闻头条自媒体系统php,新闻头条-新闻自媒体-技术博客织梦模板(带手机版)...
  7. windows11画画、绘画、画图软件在哪?
  8. TPC-DS标准规范(4)
  9. 计算机桌面视频录制,录制电脑屏幕 如何录制电脑屏幕视频?录制电脑屏幕软件...
  10. 便携式超宽带记录回放系统之高速采集卡