这一轮所谓人工智能的高潮,和以往的几次都有所不同,那是因为其受到了产业界的极大关注和参与。而以前并不是这样。

当今世界是一个高度信息化的世界,甚至我们有一只脚已经踏入了智能化时代。而在我们日常交流和信息互动中,迅速发展的多媒体技术起到了至关重要的作用。

在日前结束的“2017中国多媒体大会”上,提出了“智能媒体,创新未来”的主题。会后,我们采访了大会主席、北京航空航天大学教授李波,就当前人工智能技术在多媒体中的应用以及二者相互促进展开对话。

多媒体(Multimedia)是数据的最主要的现形式。在计算机系统中,多媒体指文本、图形、图像、视频、声音 、动画和影片等,在实际应用中,也可以多种媒体综合使用。多媒体的应用领域已涉足诸如安防、影视、娱乐、广告、艺术、教育、工程、商业及科研等诸多行业。

AI热起来,首先爆发在多媒体领域

多媒体技术是把信息技术与应用结合起来的核心技术。很多信息在现实生产和生活中的使用,都会涉及到声图文视频等,还有在我们常说的人机交互中,多媒体技术也都发挥着重要的作用。

当前这一轮的人工智能热起来,与多媒体关系很大,首先是深度学习用于语音识别,很大程度上提升了识别效果。其次是图像分析,对图像分类、人脸识别、以及图像检索等也有大幅度提升。这些都是AI与多媒体应用结合的表现。

另一方面,关于多媒体技术本身的发展。多媒体的数据量很大,其内容丰富多彩,理解难度大,它本身的内容分析就需要智能处理,目前多媒体处理正在朝着智能化方向发展。所以本次大会的主题里有一个叫做“智能媒体”,体现的就是这件事情。

关于主题中的“创新未来”,因为多媒体技术是一种与应用结合十分紧密的技术,所以说它必将在各行各业、方方面面发挥越来越重要的作用。大家目前听到的、看到的很多东西都是这样,比如无人驾驶系统,它首先要感知周围的场景,要有视觉技术支撑。又比如大家看到的机器人问询系统,它的核心在于语音识别、自然语言理解,也是以模拟人的听觉和语音处理来实现的。

所以说,多媒体技术的智能化对经济社会、生产生活的方方面面产生了重大影响,这也是另一个主题“创新未来”的由来。

图像识别和语音识别之外,有更多的AI应用在我们身边

首先呢,我们要区分人工智能和深度学习。人工智能是一种跨学科的、多学科交叉的技术,它在不同的应用行业对其的要求也有所区别。

现在所说的深度学习影响很大,它最早是在语音和图像识别取得突破。但是,深度学习只是其中一种技术,人工智能还有很多其他的技术,远远不只深度学习这种技术,例如数据分析、模式识别、智能控制等,也都是属于人工智能技术的范畴。

例如数据内容分析方面的技术,在金融行业的风控、在股票市场的监管、在电信行业的反欺诈、在智慧物流的调度等方面,也都在发挥重要的智能作用。此外,在工业生产过程中,例如各种复杂调度、零件装配、故障检测等,也都用到很多人工智能技术做支撑。

AI技术本身并没有落与不落,退潮之后也没有裸泳者

常说人工智能有“三起两落”,现在正处于第三次“起”的阶段,那将来还会有第三次的“落”吗?如果有,哪些技术和应用会成为退潮之后的裸泳者?

人工智能为什么会有所谓的“三起两落”?因为人来一直在不断地拓展自己的智力,在追求更高更大的目标,并用于方方面面。

人类发明了车辆,让我们可以跑的更快;发明制造了飞机,让我们可以飞上天空。

所以说,人工智能的起落过程并没有什么值得担忧的,它只是人来在追求更高目标过程中正常的阶段性体现。另外,落与不落,只是发展状况的一种相对说法。

但是,这一轮所谓的人工智能高潮,和以往几次都有所不同。为什么呢?因为本轮的人工智能之所以这么热,那是因为其所处的环境有了本质的变化,并受到产业界的极大关注和参与,而前两轮并不是这样。

虽然从第二轮开始,产业界对智能系统开始逐步重视,但相比这一轮来说,重视程度远远不及,并没有现在的普及和全面,对普通老百姓的工作和生活的影响也远不如现在这么大。

原因是什么?首先是现在的环境不一样了,现在是互联网时代的快速发展,另外是在大数据的背景下,再加上计算系统的高性能化(现在普通手机的计算性能抵得上以前的一台大型计算机),使得这一轮人工智能在某些应用方面可以做的很实,真正体现较高的智能特征。

当然,由于各个行业之间千差万别,其对人工智能技术的需求不尽相同,所以也使得人工智能对具体行业的影响各有不同。比如说对我们的听、说、写等相关度比较高的,以及与大数据联系紧密的行业,影响就非常大;而对于其他的行业(需要做综合的决策,而数据量又不够多),影响可能就会相对较小。

但即使是人工智能不那么热的时候,也不能说AI技术就没用了。事实上,人工智能已经悄然进入我们生活的方方面面,在潜移默化中发挥作用并影响世界。

只要人类追求智能、追求更高目标的决心不变,人工智能的高潮就会一直存在且持续下去。

数据驱动和知识驱动相结合的思维方式,是未来AI的目标

人类思维是一种综合的思维,来自两个方面:一方面是来自数据驱动的学习,通过数据在人脑中的不断抽象,就会形成高一层的语义。也就说,基于深度学习的智能,更多的就表现在这个方面。

另一方面,是知识驱动展现的智能。人类的思考是有目的的,在同样条件下,出于不同的目的,思考的结论可能不同;所以在同一个场景里,今天和昨天可关注的事不同。

原因是什么?因为我们的目的不一样。也就是说,人类思考同样存在至上而下的目标驱动;在展现智能方面,也存在利用高层知识去影响分析理解,这就是所谓的知识驱动。

在复杂的应用中,数据驱动和知识驱动都会存在,这样才能展现高水平的智能,所以说这两方面都是需要的。在我们常说的小样本分析,更需要知识驱动发挥作用。

在数据不足时,人类依靠经验也能实现正确的判断和思维;这说明机器也需要借鉴其他领域学习的知识,提高小数据或小样本下的学习效果,目前在这方面还存在着很多不足和缺陷,需要深入系统的研究。

现在的摄像设备更多是在被动采图,未来将要实现主动视觉

在视觉这件事情上,人类的视觉范畴比我们目前见到的图像和视频的范畴更加广泛。人类的视觉能感受到客观世界的方方面面,而我们在客观世界里能见到的物理现象是很多的,有声光电热、位置、方向、速度等等。

但目前的摄像头只能做到被动感知。直白的说,就是你让摄像头照什么,它就会照什么。而人类不是这样,当人类在思考需要什么之后,自己就会去主动获取什么。

举个例子,在同一个场景里,人类看到了一辆汽车。如果他要想把车牌看清楚,他就会调整视觉到车牌的位置;如果他想把驾驶员看清楚,他就会调整视觉到驾驶员的位置。

而我们的摄像头在这方面就做的比较差劲了,它并不会主动根据目标而调整自己的拍摄视觉。在主动去感知周围的场景和全方位、立体的感知周边环境等方面,做得很不够。

此外,现在大多用的是以光学摄像头为主的设备,但上面也说到了客观世界除了视觉还有很多方面,而这些仅凭光学摄像头是根本无法完全收集到的。所以我们将来会需要像激光、红外、雷达、GPS等结合起来的摄像设备。

将来计算机的感知系统应该是用综合型的视觉来完成,而不是现在被动式的采图。将来的摄像头也应该是一双很聪明的慧眼,类似甚至要超过人眼的功能。

未来的Tof深度相机需要把更多信息整合到一起

在说到深度相机和传统相机区别的时候,首先要说一下我们的客观世界。

众所周知,我们的客观世界是三维的,我们在认识世界的时候,深度信息、位置信息等是非常重要的。传统相机的成像也好、视频也好,都是二维的信息,缺乏深度信息。

而深度相机是在传统相机的基础上,加上了深度信息,使得机器在分析周围场景的时候,多了一维信息,从而提高了分析的准确性。

同时,由于客观世界远远不止深度,还有很多像温度、湿度、速度、方向等等,所以未来的深度相机应该要把更多的信息也整合到一起。

不过,在深度信息的获取方面,如在特定场景、遮挡、距离等的情况下,准确感知深度就存在着较大的困难。

所以目前的应用也相对有限,像只在室内、仓库、游戏交互等短距离的场景下,才能有理想的效果,而在其他场景则会大打折扣。

原文发布时间:2017-09-28 17:16
本文作者:纤尘
本文来自云栖社区合作伙伴镁客网,了解相关信息可以关注镁客网。

北航教授李波:说AI会有低潮就是胡扯,这是人类长期的追求相关推荐

  1. 北航教授李帅:“VR+医疗”仿真系统及关键技术分享

    "走进高校" CARA 第二期学术讲堂:智能几何计算篇,直播已圆满结束.错过直播的小伙伴,福利来了,CV君已将回放视频整理完毕,欢迎收看! 第二 part,是李帅老师的学术分享,主 ...

  2. 李向阳教授谈中科大AI承继与挑战,IT校友影响力惊人

    李根 发自 G195  量子位 报道 | 公众号 QbitAI 头像用了"双枪李向阳"的中科大教授李向阳,很忙. 这位IEEE Fellow.ACM杰出科学家.中国科学技术大学计算 ...

  3. 斯坦福大学成立以人为本AI研究院 计算机科学教授李飞飞任院长

    据国外媒体报道,当地时间周一,斯坦福大学成立了以人为本AI研究院(HAI),其目的是研究.指导和开发以人为本的人工智能技术和应用,并通过人工智能推动人类实现更美好未来的目标. 斯坦福大学前教务长.哲学 ...

  4. 北航计算机学院牛建伟教授评价,【北京】又有一大波学生踏上科学之路!中国工程院院士、北航教授、往届优秀学生分享成功经验,快来取经...

    原标题:[北京]又有一大波学生踏上科学之路!中国工程院院士.北航教授.往届优秀学生分享成功经验,快来取经 又有一大波 经层层选拔的学生 即将踏上科学之路啦! 1月27日 北京青少年科技人才培养项目启动 ...

  5. 瑞欧威尔联合创始人兼CEO 李波博士:“工业元宇宙”是为了更好赋能实体经济

    2021年12月10日,由广东省游戏产业协会.广东省虚拟现实产业技术创新联盟.深圳市科学技术协会.深圳市互联网文化市场协会指导,陀螺科技主办,深圳市科技开发交流中心.恒悦创客魔方协办,行业头部媒体游戏 ...

  6. 知乎李大海:AI 不只是噱头,满足需求才是真落地

    知乎李大海:AI 不只是噱头,满足需求才是真落地 https://mp.weixin.qq.com/s/8ONrl8cIU45Hwb4xRBhZnQ 2018年10月17日~19日,由IT168旗下I ...

  7. 国家特级数学教授李毓佩:我们欠孩子真正的数学阅读 !

    ▲ 数据汪特别推荐 点击上图进入玩酷屋 说到数学,我想起了13年一场轰动行业各界的"数学无用论"!那时微博上有个话题叫做#让数学滚出高考#,超过7成网友都表示支持,这可怕的比例就能 ...

  8. 北航教授吐槽研究生基本废了:985高校成高级蓝翔

    985硕士博士,无疑是受教育程度极高的一个群体,在学历上基本上已经是普通人的天花板了,理论上,这应该是最优秀的一批人. >>>> 然而,在学历贬值,读研成为标配的情况下,相当部 ...

  9. 北京理工大学 计算机学院 李侃,李侃(北京理工大学教授李侃)_百度百科

    李侃 (北京理工大学教授李侃) 语音 编辑 锁定 讨论 上传视频 李侃,博士,教授,博士生导师.主要从事于机器学习,数据挖掘,分布式系统等方向. 中文名 李侃 国    籍 职    业 教师专业方向 ...

最新文章

  1. 《深入理解 Java 内存模型》读书笔记(上)(干货,万字长文)
  2. 以计算机为话题写作文,以我的发现为话题作文(通用3篇)
  3. . Two Sum(C, C++, Python)
  4. Java中printmax的调用形式_媒体类型和响应式设计
  5. python命令行模式怎么输入_python获得命令行输入的参数的两种方式
  6. 区块链工作笔记0001---以太坊流程简介
  7. 5-5 多边形周长计算(继承)
  8. 浅析智慧照明,实现建筑节能
  9. 云原生 - 阿里云 SLB、CDN、SCDN、DCDN 区别在哪?如何选择?
  10. js 微信聊天框的时间显示规则,以及输出的时间格式(已优化)
  11. 宝塔面板怎么实名认证_宝塔面板安装和使用图文教程
  12. repo sync error: Exited sync due to fetch errors
  13. pytorch 实现简单二元分类器以及可视化
  14. scikit 线性回归_使用scikit学习线性回归学习和体育运动nba数据数据科学
  15. 华为OD机试 - 乱序整数序列两数之和绝对值最小
  16. ECMAScript 语法
  17. 知乎页面的html代码,Web前端
  18. 《第四堂棒球课》:MLB棒球创造营·棒球名人堂
  19. 【疯壳·无人机开发教程1】开源编队无人机-开机测试
  20. k8s 介绍与基本使用

热门文章

  1. fcfs调度算法_FCFS:先来先服务调度算法
  2. bst 删除节点_C ++程序查找具有N个节点的BST数量(加泰罗尼亚编号)
  3. 实验8 SQL Server 的存储过程
  4. 最小连通-(代码、分析、汇编)
  5. mysql 学习笔记10 常用数学函数
  6. C++ 常用排序算法
  7. $PATH环境变量的作用
  8. Linux02进程内存管理
  9. Java面试题中高级,java引用数据类型和基本数据类型区别
  10. CSS清除默认样式,面试篇