都说今年是“人工智能之年”,科大讯飞在迎来了年底收官之作。如果说,万物互联对坊间而言还是一个比较模糊的概念的话,那么,今天下午,以“AI复始,万物更新”为主题的科大讯飞2015年年度发布会就是对人工智能的全景性思考。科大讯飞董事长刘庆峰现场指出,已经发展了60年的人工智能未来将迎来三种机遇:

第一,在万物互联的浪潮下,以语音为主、以键盘触摸为辅的人机交互时代已经到来。未来3到5年,我们周围的90%的设备,将不是手机,而是穿戴式设备、智能家居以及可能是服务机器人。这时候没有屏幕离你很远,不可能触摸它,而语音为主的时代正在到来。

第二,人工智能未来一定会像水和电一样无所不在,广泛而深入到影响到我们每一个人生活。我们甚至认为在未来5年之内在这样的会场,一定会有机器人给大家端茶倒水,否则这样一个发布会实在是太没有科技含量。

第三,以语音和语言为入口的认知革命,将推动人工智能梦想成真,这是一条人工智能走认知计算的必由之路。

现场,刘庆峰发布了基于语音交互技术基础上的交互界面——AIUI,以及录音宝、录音笔、讯飞听见网、智学网和E听说等To C产品。

科大讯飞董事长刘庆峰

人工智能发展历程:聪明的助手

1956年的达特茅斯会议是人工智能研究的历史起点,至今正好是一个60年甲子。在这60年中,人工智能研究本身经历了两次波峰与波谷,而从2006年起始至今愈发升温的人工智能热,是第三次人工智能浪潮,而当下,正处于人工智能爆发的前夜。在这第三次浪潮中,中国、美国和欧洲,不约而同地将人类大脑研究上升为国家战略科研高度。

“人工智能未来会像水和电一样无所不在”刘庆峰表示。而在人工智能的三个层次——计算智能、感知智能和认知智能之中,前两者机器的能力已经超越人类,让机器实现认知智能是目前人工智能科研的焦点,这也是人区别于动物的最本质能力。

而从人类自身的发展来看,产生认知智能的标志是语言的广泛使用。所以,在第三次人工智能浪潮中,世界上众多的科学家都不约而同地从“自然语言理解”这个研究方向上,寻找人工智能的突破口,即从语音与语言入手实现机器的认知革命。科大讯飞也正是从这个方向上取得了成果。

从1998年成功研发出可实用的中文语音交互系统开始,至2014年发布“讯飞超脑”的这17年间,科大讯飞的这些成果中,包括获得NIST全球语种识别比赛的冠军,包括获得JWSLT机器翻译评测冠军,包括其产品在国内替代人工进行英语口语测试与普通话级别考试,包括其产品在教育、车载、家居、通信、硬件和国家安全等众多领域的产业化高速推进,并在这个过程中从一家大学生创业公司,成长成为目前市值超过500亿的中国高科技公司。

AIUI:机器人未来能参加高考

在产品发布环节,刘庆峰首先定义了认知智能的三大核心支撑能力:人机交互、知识管理与推理学习。而随后科大讯飞发布的讯飞超脑2.0科研项目,正是围绕这三方面持续展开,不但赋予机器“能听会说”的能力,还能赋予机器“能理解会思考”的能力,使机器人能够同人一样参加高考。

而在讯飞超脑的产业化应用产品层面,刘庆峰发布了对科大讯飞具有里程碑意义的人机交互新产品——AIUI。刘庆峰认为,在实际上已经到来的“万物互联”时代,客观上对人机交互提出了更高的要求。但是,一方面目前大多数设备没有屏幕并且与用户之间有一定的距离,另一方面随时随地的多方交互的需求越发明显。

于是,科大讯飞又在此次大会上定义了“万物互联”时代的人机语音交互标准,其基本能力应该包括三方面:远场识别、全双工、多轮交互。

AIUI集成了包括双全工技术、麦克风阵列技术、声纹识别技术、方言识别、语义理解技术和内容服务等——科大讯飞一些系列尖端科研成果和完善服务,代表业界最高水准的技术产品。开发者将可以一键获取解决方案,通过集成麦克风阵列、集成SDK以及定制云端服务等方式。

科大讯飞此次也将AIUI应用到了发布会中,现场,所有发言人的演讲被实时同步转写成文字,显示在两侧大屏幕上。

人机交互:打破山东大汉困境

也许你对年初那个被车载语音导航逼疯的山东大汉还印象深刻,一个普通话不标准的山东人,在环境嘈杂的车上,远距离与不那么智能的导航交流,产生的结果就是让人抓狂的识别与交互。而本次发布会上,科大讯飞通过远场抗噪、方言识别、全双工交互、多轮对话、纠错等系列技术,成功打破了山东大汉的困境。

科大讯飞通过定位、麦克风波束形成、回声消除、抗混响、唤醒一系列技术形成的系统解决了远距离识别问题。其次,科大讯飞实现了人机对话控制由单工(如手机语音助手的按一下说一下)转变成全双工(人和机器可以像打电话那样同时听和说)的交互转变。

多轮交互实现了机器对上下文连贯理解,使得人机交流不再是单调的一问一答,而是可以连续交流。再加上对话纠错机制,人可以随时纠正对话中双方的错误,使说过的话不再是覆水难收。通过以上一系列技术形成的系统,极大降低了环境、说法、习惯等对人机交互的干扰,实现高度自然的人机交互体验。

智学网:机器阅卷

在讯飞超脑的应用层上,科大讯飞面向教育市场推出了智学网与E听说。

目前,已有全国31个省市的8000万师生在使用科大讯飞面向K12教育所推出的高科技教学与考评产品,希望解决“老师忙、学生盲、资源茫”的教育行业痛点。

具体产品方面,不仅实现了语音与文字的识别、合成与分类,还实现了智能批改、全科阅卷、资源库自动建设等真正具备“人工智能”的产品目标,在教育资源的高效和个性化辅导方面做了试水。

刘庆峰表示,智学网与E听说是之前推出的讯飞超脑的应用产品,未来还将有更多人工智能技术在C端教育市场发力。

目前,科大讯飞中文作文机器阅卷技术在2015年合肥、安庆中学会考上已经取得应用,人机阅卷对比结果显示机器阅卷已经比人工阅卷更准确。

讯飞听见:可能会让速记失业

针对大型会议、现场采访、个人交流等场景下的内容整理需求,科大讯飞集成了单麦克解混响技术、阵列解混响技术、口语化识别等众多最新研究成果,全球首发语音科技产品——讯飞听见录音宝、录音笔和讯飞听见网。

刘庆峰表示,实际上,音文转写是当下都市生活的一种经常性需求,在正式发布之前,录音宝产品已经有了超过100万的用户就是这种需求的证明。而随着流媒体的不断演进与普及,相信,在未来的图文直播时代,科大讯飞的音文转录产品的价值将会更加凸显。

在现场,科大讯飞还邀请了10家知名速记公司的工作人员,进行同台PK。从现场两侧大屏幕效果看,其速度和准确率可能会在未来淘汰很大一部分速记从业人员。

据悉,科大讯飞网能够实现双屏智能编辑、角色自动分离、音频精准定位、快速按句回听、发言实时上屏、格式多种多样等功能;录音宝能解决常见的录音回听不方便、导出录音复杂、录音文件无法重命名等问题;录音笔既增强了传统录音笔的录音音质、播放效果,更配备智能语音转文字服务。

从科大讯飞发布的产品来看,订票、改签、开空调、关加湿器、批改作文等等一律完成,普通话、英语、方言也都能分辨,俨然一个聪明的生活助手,并在没有屏幕的情况下,通过语音完成交互。

正如刘庆峰所说,在实际上已经到来的“万物互联时代”,语音为主,触摸、图像、手势为辅,将成为人机交互的新常态,而在这种人类生活的新常态中,人工智能技术的突破是用来延伸人类能力而非替代人类的。

原文出处:科技行者
转载请与作者联系,同时请务必标明文章原始出处和原文链接及本声明。

科大讯飞:5年内 科技会场没机器人端茶倒水就太low了相关推荐

  1. 5年内 科技会场没机器人端茶倒水就太low了

    都说今年是"人工智能之年",科大讯飞在迎来了年底收官之作.如果说,万物互联对坊间而言还是一个比较模糊的概念的话,那么,今天下午,以"AI复始,万物更新"为主题的 ...

  2. 波士顿机器人升级,端茶倒水开门样样精通

    其可以端茶倒水拿饮料,还能在给你饮料的同时,冲你撒个娇. 2月13日,据报道,波士顿动力公司的SpotMini机器人再次迎来了升级,通过增加一个灵活的机械臂和机械爪来加强它的力量.配备了机械爪的Spo ...

  3. 985硕士拒绝端茶倒水,为什么90后不讨好领导了?70后:三变两不变

    我,女生,985硕士,今年入职事业单位办公室.每次开会和接待,70后的领导都安排我端茶倒水.第一次端茶倒水,我努力做通自己的思想工作.第二次端茶倒水,心情超级DONW,感觉超级LOW.第三次,我忍无可 ...

  4. 义乌机器人餐厅价格表_义乌一餐厅机器人端盘萌翻吃货

    "您好,菜来了,请您品尝!"憨态可掬的机器人让前来就餐的市民吃了一惊,体验了不一样的就餐氛围. 昨天上午,义乌首家机器人餐厅现身义乌工商学院创意园.餐厅一开张就吸引了众多市民赶去尝 ...

  5. 优地、云迹、擎朗、普渡科技的服务机器人场景战争

    疫情后期,"无接触"服务被广泛应用,在酒店.餐厅.家庭.景点等服务场景,机器人替代人工的现象越来越普遍,服务机器人的春天到了吗? 近日,商用服务机器人"优地科技" ...

  6. 字节新专利可用人脸图像生成数字人;滴普科技获1.1亿元融资;科大讯飞成立人工智能科技公司 | 每日大事件...

    数据智能产业创新服务媒体 --聚焦数智 · 改变商业 01.字节新专利可用人脸图像生成数字人 近日,北京字跳网络技术有限公司申请的"数字人生成方法.装置.存储介质和电子设备"专利公 ...

  7. 互联网快讯:普渡科技发布商用机器人“出尘C1”;极米产品持续热销获用户好评;法院判决阿卡索赔偿猿辅导20万;巨量引擎上线“巨量算数”微信小程序

    国内要闻 科大讯飞拟出资1.1亿元参设合肥连山创新产业投资基金,关注人工智能.生命科技等方向: 阿里巴巴2022财年第二财季财报:营收2006.9亿元.净利润285.24亿元,全球年度活跃消费者达12 ...

  8. 玩转未来科技感!高端电商海报设计素材

    多设计师经常会遇到科技场景合成等难题,把控不准科技感的氛围表现.对科技感场景合成思 路及风格调性把控,是个难题. 还好优图网,带来玩转未来科技感!高端电商海报设计素材! 虚拟城市未来发展建设革命科技海 ...

  9. 宝元系统通讯软件recon_优软科技会场式电话录音系统

    电话录音系统用于实时地监控和记录电话通讯信息,包括电话号码.呼叫时间.通话内容等.有着监督服务质量.营销分析,和解决纠纷等重要作用. 优软科技会场式录音 1 基本功能:提供基本的录音.监听.查询.管理 ...

  10. html下拉刷新原理,科技常识:移动端下拉刷新头实现原理及代码实现

    科技常识:移动端下拉刷新头实现原理及代码实现 2021-05-24 21:23:20 • 互联网 今天小编跟大家讲解下有关移动端下拉刷新头实现原理及代码实现 ,相信小伙伴们对这个话题应该有所关注吧,小 ...

最新文章

  1. textarea 在浏览器中固定大小和禁止拖动
  2. labview生成HTML报表,LabVIEW201
  3. 为衣服添加NFC功能:挥下袖子就能安全支付,打开车门坐进去就能启动汽车|Nature子刊...
  4. 字节「大力」做教育,依然技术思维,1万员工参与,三年不考虑盈利
  5. 不定宽高的div水平、垂直居中问题
  6. Lesson 4.1-4.2 逻辑回归模型构建与多分类学习方法逻辑回归参数估计
  7. mysql 1067 42000_MySQL:ERROR 1067 (42000): Invalid default value for 'end_time'
  8. shell softech 面料_求高人指点 猛犸象的SOFTECH面料和GTX PROSHELL面料哪个好
  9. 小程序入门学习14--用户管理
  10. 第八届蓝桥杯第六题最大公共子串
  11. SQL SERVER 查看数据库表的字段类型,是否允许为NULL,默认值,主键等
  12. QQ浏览器该站点长时间无响应_消除CNZZ.站长统计代码被Chrome浏览器警告的操作...
  13. Java实战之管家婆记账系统(24)——项目总结
  14. Qt 解决窗口在多个显示器上显示位置设置问题
  15. 三菱plc pwm指令_三菱PLC的MPS、MRD、MPP指令用法
  16. 偏偏在面试的时候踏入一个大坑--360浏览器兼容模式
  17. std.h对应linux头文件,bits/stdc++.h头文件介绍(包含源代码)
  18. c语言outl函数,Outlook MAPI开发指南
  19. ai与虚拟现实_AI使虚拟现实和增强现实更加真实的8种方式
  20. 将两个iso镜像刻录到一张dvd光盘上,当然是做系统启动盘用

热门文章

  1. 什么是中台?这篇漫画总算讲清楚了
  2. 昨晚家里停网后,我动了邪念用Python破解了隔壁小姐姐的wifi密码
  3. 一种支持多种流媒体协议的播放内核
  4. Android Multimedia框架总结(十三)CodeC部分之OpenMAX框架初识及接口与适配层实现
  5. 大学生使用计算机的情况英语作文,关于网络的大学生英语作文(精选10篇)
  6. php连接mysql的字符集问题_关于php7 设计链接mysqlutf8mb4字符集的问题
  7. c语言 头文件卫士详解,C 语言条件编译与防止头文件重复
  8. python数据库定时更新脚本——(一)GitPython拉取代码
  9. java 读取文件的大小_java读取文件大小
  10. python手机安装不了软件怎么办_安装python安装方法