点击上方蓝字 关注网易智能

聚焦AI,读懂下一个大时代!


【网易智能讯 1月29日消息】《麻省理工科技评论》新兴科技峰会EmTech China昨日在北京开幕。会上,香港中文大学信息工程系教授汤晓鸥发表了题为《人工智能的中国式十月革命》的演讲,通俗浅显地阐述了人工智能需要原创技术,以及商汤科技目前在计算机视觉方面的进展。

汤晓鸥透露,商汤科技目前除了人脸识别,还在研发视频分析,目前可以识别每一帧情节分类,每一个镜头是打斗场景还是恋爱场景。

汤晓鸥称,实际上所有的任务,都是我们人安排给机器做的,机器是按照我们的指令在做事情,不存在机器控制人类这样的事情,AI的真正目的是帮助人类,帮助我们提高生产效率。(小羿)

以下为汤晓鸥教授演讲实录:


汤晓鸥:今天我讲的题目是“人工智能的中国式文艺复兴”,这个题目我在上海讲过一次,我这个人不太喜欢重复自己,于是我又想了一个新的题目,叫“人工智能的中国式十月革命”。

我想大部分中国人都应该知道这部电影《战狼》。一下子赚了56亿。这在15、20年前是不可能的;那时候中国的一部电影是不会赚这么多钱的。这有很多原因,其中一个非常重要的原因就是今天我们都愿意花钱去电影院看电影了,而15年前、20年前,很多人会去买盗版的VCD,或者去网上下载一个盗版。如果这样,导演和演员也就没有动力再继续坚持下去了。今天中国电影的成果最重要的推动力就是我们对原创和版权的尊重。

我们现在不是只有一部电影这样成功,比如这部《羞羞的铁拳》羞羞的就赚了22亿,《芳华》是一部文艺片,也能达到14亿的票房,《前任3》的票房是18亿,平均每个前任6亿,《无问西东》是一部非常有情怀的文艺片,也做到了5亿票房。都非常不容易。

所以,对原创的尊重使得中国的原创电影不断往前发展。在三四十年代,全球电影发展起来时,中国电影并不落后,像《马路天使》、《一江春水向东流》一点也不输给好莱坞电影。即使在那个战火连天的年代,中国还能够拍出这些好电影,一个原因可能也是当时没有DVD和互联网来帮助盗版。

再往前,说一下文艺复兴的时候,如果米开朗基罗的这些作品或者任何一个艺术品很快有人进行复制,那么他可能也赚不到什么钱,也可能活不下去。所以,对于原创的尊重也是文艺复兴能真正兴起的一个原因吧。

说到原创,下面我们来讲讲人工智能。一提到人工智能,大家脑海里第一个想到的公司是哪一家呢?是的,我相信大家都猜到了——那一定是商汤科技。请大家不要笑......好吧,目前应该是谷歌,但是总有一天,我相信人工智能这个热潮一定会过去的,等这个热潮过去了以后,商汤一定会成为人工智能最顶级的公司。

那为什么是谷歌?因为谷歌真的把资金投入人工智能发展,2015年的研发经费就是120亿美金。2014年有一家公司叫DeepMind,只有12个员工,没有赚钱,只是在用深度学习玩游戏和下棋,但是谷歌就花了6.6亿美金收购了这家公司。如果是在中国,大家就会花几百万美金把人一个个挖过来,那要便宜得多。但是如果那样做的话,就不会有后来的AlphaGo了。

那么AlphaGo之后大家还能做点什么呢?谷歌又做了AlphaGo 2和AlphaGo Zero,有些公司开始学着AlphaGo下围棋,还有的公司选择打扑克牌,这从某种意义上讲,都是跟着别人的后面做事情。

真正有意义的事情是在AlphaGo之前你做了什么?有没有做什么事情让机器在某项任务上战胜人类。在AlphaGo之前我们做了一件事情,2014年,我们团队从事人脸识别,在全球第一次让机器的人脸识别能力超过了人的眼睛,像AlphaGo一样,在某一个人类定义的单项任务上,机器超越了人类。

超越了人类就过了一条红线,而过了这条红线就可以在工业上进行应用了。但是在真正应用的时候,又发现了很多问题,过了红线还是不够用的,从实验室到大规模产业化还有很长的路要走。2014年,我们用20万人脸来对机器进行训练做到了98.5%的准确率,而人是97.5%;2015年我们用30万人脸进行训练,达到了99.55%的准确率;2016年,我们用6000万人脸训练可以达到了百万分之一的误识率;2017年,我们用20亿人脸训练可以达到一亿分之一的误识率,而这样的误识率才可以真正地应用到各行各业,包括监控、金融、安防、手机等行业。所以,我们和高通签署了全球AI战略合作协议。

那么除了人脸识别,我们现在还做什么?由于时间关系,我从我们做的十几个行业里选出一个来简单介绍一下——视频分析


下面这个技术是行为检测:


这是里约奥运会的跳水比赛直播,大家可以看到过了9分钟也没有看到跳水的内容,要花一大堆时间看一些枯燥的内容介绍。所以,我们用计算机视觉分析的方法,可以从很长的一段视频里把重点内容检测出来,你就可以直接跳过没有意义的部分,直接看这些有趣的、真正的跳水的镜头。

下面这个演示是基于内容的视频搜索:


在电影中我们可以把各种各样的片段搜索出来,比如说你想搜索武打动作片段,或者喜剧片段,我们可以直接把它搜索出来,或者你想搜索科幻的,我们可以把科幻的片段搜索出来。

下面这个演示是用自然语言描述来进行场景搜索:

我们用自然语言来描述一个电影中的场景,然后它就可以自动根据你的描述把这个电影片段搜索出来,比如,我们要搜house of cards中的一个片段,“Claire和Frank坐在蓝色沙发上”,大家看到下面这段场景就出来了。

另外我们不但能把视频分析出来,还能理解这个视频,然后用自然语言描述出来。比如下面这些运动视频,机器就可以像解说员一样来描述运动场上发生的事情。

IJCV是我们这个领域的两大顶级杂志之一,作为IJCV的主编,我会在每年的ICCV和CVPR两个计算机视觉顶级会议上,主办IJCV Night晚会,邀请几百位顶级学者参加。去年10月份,我们在威尼斯的Lido酒店举办了这个晚会。

上世纪的一部美国电影《美国往事》就是在这个酒店拍摄的,下面这个演示里我们把电影场景里的所有物体都检测出来,演员是哪一个演员,他穿的是什么衣服,这个场景是在餐厅里,所有的桌子、花、椅子全部能够实时的自动检测出来,这样的技术在以前是非常难的,但是现在我们都可以做到了。

再回头来看我们如何用这些技术来分析前面提到的电影《战狼》和《羞羞的铁拳》,我们通过分析这些演员的动作和他们之间的关系,可以分析出来在不同的场景之下,这两个演员是谁,在做什么,这个片段是什么类的情节。

同时,我们可以识别每一帧情节分类,每一个镜头是打斗场景还是恋爱场景。我们也可以把一个电影最精彩的镜头提取出来,大家可以挑选比如动作的精彩镜头、感情戏的精彩镜头、悲剧的精彩镜头等等。

那么总结起来,我们在做什么呢?我们是在教机器看电影,一开始我们是教机器来识别人脸,Google是在教机器来下围棋,而现在我们来教机器代替人看电影。这个感觉有点怪,我们让机器来做下棋,看电影,玩游戏这些有趣的事情,然后我们人类只负责给机器充充电,维修和保养。

我觉得大家听了这个一定觉得很可笑。实际上所有的任务,都是我们人安排给机器做的,机器是按照我们的指令在做事情,不存在机器控制人类这样的事情,AI的真正目的是帮助人类,帮助我们提高生产效率。

最后给年轻人留下两句话:

第一句,电影一定要自己亲自去看。

第二句,AI这个词在中国拼音翻译过来就是“爱”,所以谈恋爱也要自己亲自去谈,否则你就不止“前任3”了,很有可能“前任4”、“前任5”了。

谢谢大家!

网易智能

聚焦AI 读懂下一个大时代

长按扫码关注我们


加入社群


AI社群(AI专家群、AI黑板报)火热招募中,欢迎对AI感兴趣的小伙伴,添加小助手微信kaiwu_club,说明身份即可加入。

往期精华


人物专访  沈向洋 | 于尔根 | 洪小文 | 李德毅 | 尤瓦尔 | 哈萨比斯 | 宋继强 | 杨强 | 余凯 | 邓志东 | 芮勇 | 戴文渊 | 石博盟 | 韦东 | 黄学东

行业特稿  抢滩智能音箱(上) | 抢滩智能音箱(下) | 自动驾驶行业素描(上) | 自动驾驶行业素描(下) | 机器翻译技术与应用

重磅报告  麦肯锡(二) | AlphaBeta & ABC | 埃森哲 |  英国政府 | Internet Society | Forrester | VertoAnalytics | 麦肯锡(一) | 苹果公司 | 耶鲁大学


AI大牛汤晓鸥:AlphaGo之后大家还能做点什么?| 演讲相关推荐

  1. 大咖 | 香港中文大学汤晓鸥教授:人工智能让天下没有难吹的牛!

    授权转载自网易智能 责任编辑:唐姝_NABJS5165 阿里讲"让天下没有难做的生意",做人工智能是讲"让天下没有难吹的牛". 中国科学院深圳先进技术研究院副院 ...

  2. 首部高中AI基础教材出版发布:汤晓鸥主编,40所重点中学引入

    李根 发自 凹非寺  量子位 报道 | 公众号 QbitAI 教育要从娃娃抓起,AI可以从高中学起. 今天(4月28日),<人工智能基础(高中版)>教材正式出版面世,华东师范大学出版社.商 ...

  3. 汤晓鸥与MIT、宾大教授共话AI:热潮终将退去,人工智能的中国式文艺复兴

    "<前任3>票房赚了18亿,那是一个前任6亿啊!" 香港中文大学信息工程系教授.商汤科技联合创始人汤晓鸥昨天在<麻省理工科技评论>与DeepTech深科技主 ...

  4. 商汤科技汤晓鸥:其实不存在AI行业,唯一存在的是“AI+“行业

    https://www.cnblogs.com/DicksonJYL/p/9684671.html 9 月 17 日,2018 世界人工智能大会在上海召开,在上午主论坛大会上,商汤科技联合创始人汤晓鸥 ...

  5. 汤晓鸥纵论商汤AR:AI驱动发力已超3年,落地多个场景

    乾明 发自 友谊宾馆  量子位 报道 | 公众号 QbitAI 商汤AR,AI驱动,已经落地多个场景. 刚刚,在IEEE支持举办的2019国际混合与增强现实研讨会(ISMAR 2019)在北京召开. ...

  6. 汤晓鸥:一位被人工智能事业耽误的“脱口秀大师”

    编者按:2018年12月28日,由网易智能.清华大学数据科学研究院和25家评审机构共同评出的「2018中国AI英雄风云榜」年度人物榜单揭晓,10位人工智能领域的从业者获奖.其中,商汤科技创始人.香港中 ...

  7. 汤晓鸥为CNN搓了一颗大力丸

    夏乙 发自 凹非寺 量子位 出品 | 公众号 QbitAI 大把时间.大把GPU喂进去,训练好了神经网络. 接下来,你可能会迎来伤心一刻: 同学,测试数据和训练数据,色调.亮度不太一样. 同学,你还要 ...

  8. 汤晓鸥:人工智能在中国有点过热了,我想泼泼冷水

    雷锋网按:近日,商汤科技创始人汤晓鸥在基石资本2017年投资人年会上发表演讲,为过热的人工智能"泼泼冷水"的同时,也针对于投资人认为包括商汤在内的人工智能的"高估值&qu ...

  9. 专访香港大学罗平:师从汤晓鸥、王晓刚,最早将深度学习应用于计算机视觉的「先行者」

    虽然 ICCV 2019 落幕已近两周,但是这场对于华人研究者而言具备「转折点」意义的国际学术顶会在大家心中掀起的波澜,想必依旧未了. 在今年这场 CV 领域的学术盛宴中,我们一如既往地看到了不少长期 ...

最新文章

  1. Linux学习准备工作
  2. Java连接数据库(4)
  3. 《敏捷可执行需求说明 Scrum提炼及实现技术》—— 1.2 识别不确定性的影响
  4. 1024华为HDC值得拥有
  5. 前端学习(2999):vue+element今日头条管理--element导入
  6. [转]webkit webApp 开发技术要点总结
  7. 【网络信息安全】密码学入门笔记
  8. 别人家只会编段子,谷歌带大家找乐子 | 愚人节の真 · 大型线下踏春游戏
  9. 课堂练习--最大子数组和
  10. 最大似然估计_什么是最大似然估计
  11. summernote 字体名字不显示_觉得 Windows 10 显示字体不好看吗? 教你轻松更换成 Mac 字体版本。...
  12. 设置eclipse中的编辑区的背景颜色、注释文字的颜色、修改注释内作者名和时间...
  13. django 文件下载到本地
  14. 协方差的计算公式例子_协方差公式_协方差的计算公式例子
  15. 网络共享中心的计算机名,电脑提示“请启用网络和共享中心中的网络发现”解决方法...
  16. 计算机无法传输文件,qq无法传输文件_电脑文件无法通过QQ发送怎么办
  17. 二进制堆的C++实现及其在机器调度(LPT)上的简单应用
  18. 结对编程——自动生成数学试卷的系统(javaswing,mysql)by 陈松刘宇航
  19. HDU 3265 - Posters
  20. python全国计算机,加入 Python 科目,全国计算机等级考试迎来新调整

热门文章

  1. Java线程池的使用(合理设置线程池的大小)
  2. java读取tif图片_java读取tiff格式图片信息的方式。
  3. iOS KVC 简介
  4. 图片优化须知的8个小技巧
  5. 计算机教学论研究生学校,渤海大学课程与教学论(计算机)硕士点介绍
  6. 最快速的寻路算法 Jump Point Search
  7. 柏格森:矛盾的非进化论者
  8. 汇富纳米冲刺创业板:拟募资6.25亿 王跃林堂叔侄控制近50%股权
  9. node中使用consolidate后报错Cannot find module 'ejs'
  10. crm软件实现零售的必要性