简介:2014年,阿里巴巴悄悄启动了智能语音项目,6年过去了,它长大成了国内第一。国际权威调研机构IDC公布《中国AI云服务市场半年度研究报告》,阿里云云上AI表现出色,其中语音AI在智能语音、对话式AI两个领域拿下市场份额第一,市占率分别为44%和57%。

“您的包裹在菜鸟智能柜仍未提取,取件码XXX,请尽快取出。”对于忙碌的都市人来说,手机上的快递信息提供了很多便捷。

很多人不知道的是,快递派送之前打来的电话,派送的快递柜信息等,都离不开阿里云语音AI。

2014年,阿里巴巴悄悄启动了智能语音项目,6年过去了,它长大成了国内第一。国际权威调研机构IDC公布《中国AI云服务市场半年度研究报告》,阿里云云上AI表现出色,其中语音AI在智能语音、对话式AI两个领域拿下市场份额第一,市占率分别为44%和57%。

从服务阿里经济体到服务百业,阿里语音成黑马

如果你家里突然断电,你拨打电力抢修电话,去年之前,经常电话占线中,很难打通。但电力抢修电话,今年突然变得亲民起来了,一拨就通。这离不开全国首个虚拟人工智能配网调度员帕奇的功劳。

去年,帕奇在杭州上线,它的大脑里存储着调度规程、安全规程、分析报告等数十万字的文本材料,还有上百TB(太字节)的设备、人员、电网拓扑等基础数据,5000小时语音数据,它利用知识图谱技术加工和存储这些知识,形成自己的判断和理解,最终替代人工实施配网调度。帕奇最多可以同时拨打200个电话,可以24小时不间断工作,并准确无误地完成海量数据的监视工作。

当帕奇发现电网故障时,它会第一时间发出故障警告,电话联系相关抢修专家,并准确计算出抢修专家到达抢修现场所需要的时间、导航路径等。

帕奇上岗前,配网调度员每天需要接通100多个电话,通话超过200分钟,实时监控500条信息,配调早晚高峰期的电话同时呼入量高达40次,根本来不及接通,现场人员需要长时间等待。智能调度员大大提高了调度效率,传统的电力调度工作,帕奇轻而易举就能完成。如今,现场人员的等待时间已经缩短至1分钟。

帕奇的语音技术就来自于达摩院语音实验室。帕奇能听懂工作人员打来的电话,自行组织语言与对方交流,进行多轮人机对话,它还会说杭州话、萧山话。

未来,像帕奇一样的电力大脑能替代配网生产指挥领域50%以上的人力工作。以杭州为例,可减少配网调度、抢修指挥客服等200人以上,每年节约人力成本超3000万元。

阿里语音AI服务于全国近千个客服中心系统,助力近百家生态合作伙伴智能客服解决方案,让全国近亿用户体验到阿里智能语音的强大能力。

阿里语音技术来自达摩院,2014年,阿里成立了达摩院的前身iDST,最初的服务对象是阿里经济体内部的诉求。“语音技术最开始一展身手的场所就是客服呼叫中心,淘宝客服、阿里集团、蚂蚁集团、钉钉、高德等这些传统的客服呼叫中心,都进行了语音智能化改造。”阿里云达摩院语音AI专家鄢志杰告诉记者,以语音帮助阿里经济体内部业务取得了很大成功,例如,今年疫情期间大火的钉钉也由达摩院提供技术支持的,用户在钉钉发语音,接收的人瞬间就能看到文字信息,这种顺滑的语音转文字体验,幕后英雄之一就是达摩院先进的语音识别技术。

把客户的命交还给客户,阿里语音靠两大绝招找到市场钥匙

你家中天猫精灵陈乔恩、许魏洲、朱正廷、哆啦A梦的声音是怎么来的?原来是阿里语音AI学习了明星不到半小时的录音语料,就“变”出来的。

只要一个明星的少量已有声音语料,阿里语音AI就可以学得惟妙惟肖。如果普通人想用自己的声音定制一个语音AI,只要按照要求录二十句话,也会自动生成你自己的伴读声音。

自2017年开始,阿里的智能AI技术开始对外输出。“我们有个口号叫达摩院技术零时差上云。阿里用到所有的好的语音技术,都会以最短的时间通过云的方式,向阿里云上所有的客户提供,零时差就代表了一种态度,这个技术不是说只有阿里能用,大家也都能用。另外,我们还会去关注这个技术如何能够商业化,能够产生客户价值。”鄢志杰表示,与传统语音技术厂商“自产、自销”模式不同,阿里云采用了被集成、自学习全新服务模式,迅速打开了市场。

原来主要服务阿里经济体的语音AI,刚开始做市场推广时,有点不适应。“原来在阿里内部做的时候,各个部门都可以互相补位。但外面行业客户就不存在补位的可能。” 鄢志杰说,他们在摸索的过程中,很快调整了打法。

以语音AI的细分应用场景之一的法院为例,传统的语音AI厂商,基本任务就是把整个庭审的过程转换成文字,变得结构化,有利于后面的判决等应用。阿里的智能AI开始也想这么干,但他们很快发现了问题所在。

“首先是地域广,中国有很多的省份,有一些口音、方言的问题。同时,非AI的成分在这个场景里面也不少,怎么能做一个法官办案系统、法院卷宗管理的系统,开庭时展示在屏幕上内容的应用系统等。我们创建了被集成的模式。简单的说,我们只做最擅长的语音AI内容,其他的非AI内容,交给司法领域的一些头部的集成商,比如说让像华宇、云嘉这样子的公司来集成我们,然后做出一个法院综合的应用系统。”鄢志杰说,这种轻资产模式迅速打开了市场。

阿里语音能力覆盖政务的40余个场景,其中智能庭审语音识别覆盖超过全国20个省的8000间线下法院,覆盖率近50%。互联网庭审覆盖15000余间线上法庭,覆盖率超过90%。阿里和超过20个政务生态合作伙伴都达成了合作。目前在呼叫中心、电信运营商、法庭庭审三类场景中,阿里语音AI拥有排名第一的客户认知度。

自2017年开始,阿里语音开始进行自学习的升级。“我们发现除了开箱即用的基本通用模型外,很多客户还需要根据行业数据和知识做个性化定制。我们突然之间发现都光靠我们自己吭哧吭哧去做,不具备复制性和推广性。原因是我们不可能在每个领域都铺下这么多人力、物力来做。同时,我们来做也并非是最专业的。转换一个思路,我们通过推出自学习的产品,能把语音AI定制能力赋予行业里的实践者,在他没有很多语音领域专业知识的情况下,能够简单易用地使用我们自学习的产品,在安全环境下灌注行业里的数据和知识,就能够达到在他的行业里,世界上顶尖的语音交互的效果。有了这个自学习能力,等于充分释放了生产力。”鄢志杰说,阿里云在2017年上线了语音自学习平台,开放AI定制能力,授人以渔,帮助用户自主定制语音AI。目前,阿里云的客户和合作伙伴已在该平台开发3万多个模型。

阿里云的语音自学习平台提供了一套针对声学模型和语言学模型的定制训练流程,能让用户在安全环境中灌注行业数据,在用户完全不了解语音语言算法的情况下,快速、便捷地定制自己的语音模型。在中国移动项目中,基于阿里语音自学习平台,合作伙伴仅用短短两周、数十小时数据,便将湖北、福建两省识别率优化至92%以上;在杭州虚拟人工智能配网调度员项目中,合作伙伴使用自学习平台,成功地将识别率从76%提升到93%;疫情期间,湖北的智能疫情机器人使用阿里语音AI自学习平台,湖北口音语音识别率从62.5%提升至94.4%;某合作伙伴使用自学习平台在一个月之内从无到有打造了全新的俄罗斯语和阿拉伯语语音识别模型,识别率均超过85%。

“在传统的语音技术服务模式下,客户如果有语音优化需求,需要跟技术方不停打磨,甚至需要把行业数据交给语音技术提供商。有了自学习平台,用户完全可以自己构建模型,真正把命掌握在了自己手里。” 鄢志杰表示,阿里云不会触碰客户数据,客户数据隐私绝对安全。

目前,阿里语音AI已经拥有5万多家客户,包括阿里经济体内部客户如淘宝客服、天猫精灵、高德地图、菜鸟物流助手等。在阿里经济体外部,阿里云语音AI技术已经应用于招商银行、广发银行、浙江高院、中国移动、中央电视台、华宇、字节跳动、海尔、康佳、滴滴、新浪微博、趣头条、海底捞、惠普、vipkid、上海地铁、小i机器人、丁香医生、喜马拉雅、掌阅等多个客户,覆盖教育、金融、互联网、家电、出行、传媒、交通、餐饮、通信、医疗等各行各业。

**今年中国云上人工智能市场近20亿美元,阿里云占44%份额
**
国际权威调研机构IDC公布《中国AI云服务市场半年度研究报告》,阿里云云上AI表现出色,在智能语音、对话式AI、机器学习三大领域获得6个维度第一,以44%、57%、29%的市占率位列三大领域市场份额第一,超过百度云、腾讯云、华为云、AWS、微软Azure等云服务厂商。

IDC报告调研了国内主要云厂商的云上AI服务,领域涵盖人脸人体、图像视频、智能语音(ASR&TTS)、对话式AI、NLP、机器学习六类。阿里AI获得智能语音领域产品数量、市场份额、API调用量三项第一,对话式AI领域市场份额、API调用量两项第一,机器学习领域获得市场份额第一。

2月28日,阿里巴巴语音AI技术成功入选MIT2019年“全球十大突破性技术”。MIT认为,阿里巴巴已拥有比谷歌更好的AI语音技术,可以完成复杂的人类对话功能,甚至可读懂人类的潜在意图。阿里巴巴也是唯一上榜的中国科技公司。

“通常一个行业五年复合增长率达到百分之五六十,已经是一个非常高潜力的市场了。AI云服务市场绝对是一片蓝海。” IDC分析师卢言霞表示,中国AI云服务市场的增长,从2018年到2024年这六年的年复合增长率93.6%,这是非常高的复合增长率。

卢言霞表示,在云上语音服务厂商方面,阿里占据主导地位,2019年阿里云的语音服务大概占到44%的市场份额,接近一半的市场。“其实之前可能连我自己都没有了解到,阿里云能够在语音这块做得这么好。我们的确看到阿里云在这几年在生态合作伙伴这方面走得非常快,也聚拢了非常多的合作伙伴。”卢言霞表示,在智能云语音服务市场,以阿里云为代表的云服务厂商占据越来越重要的地位,甚至将来有可能会超过原来做本地部署的一些语音技术厂商。短期来看,在AI领域,主流趋势仍是私有化部署。但云服务、混合云的浪潮也将带动AI云服务市场的快速增长。随着技术的升级,未来3~5年,今天用户已经部署的AI产品,也有可能被新一代更智能的产品替代。

对于接下来的智能云语音市场,卢言霞认为,从技术角度,整个AI正面临很多技术突破,例如人脸、人体识别,嘈杂环境的语音交互等,未来在应用领域还会有很多技术突破。从应用来讲,目前只有20%左右场景用到了AI,未来的有非常多的应用场景有待去落地。AI智能语音除了庭审、客厅、呼叫中心等消费级产品外,未来会在会议服务、医疗诊疗记录转文字、泛工业等领域陆续落地。

“大家不妨去看看还有哪些场景是今天的技术做不了或者做不好的,而且是高价值的,这些场景都会随着技术的发展逐渐解锁。”鄢志杰说,阿里语音团队有个口号叫“无处不在的语音交互智能”。他们的梦想是,今后无论何时何地,无论是在家里、办公室、公共空间,还是在车里,所有人所在的空间当中,有一天都会有语音交互的触点或入口,可以跟人交互。

转自:https://www.thehour.cn/news/385576.html

钱江晚报·小时新闻记者 张云山

原文链接:https://developer.aliyun.com/article/769918?

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

6年前布局,如今阿里智能语音成行业第一,我们的快递、客服都离不开它相关推荐

  1. 阿里智能语音翻译和科大讯飞(机译)语音翻译的结果对比

    研究生考虑到需要写一些会议记录,往往都要先录音,然后听一遍,才能编辑成文字,展现出来.很麻烦,费时费力.所以我就抽时间研究了一下阿里的语言转换和讯飞的. 阿里的智能语音交互 先是买的阿里的服务器,os ...

  2. 基于讯飞语音,百度语音,图灵机器人的智能语音机器人毕业设计第一天

    语音机器人C语言终极版 c代码更新的地址: https://github.com/1158114251/-Intelligent-speech-robot 视频地址: https://www.bili ...

  3. 阿里云智能客服系统:包括智能导航、客服助手、智能外呼、呼叫中心、在线客服、智能培训等。经阿里内部多年实际使用演变而来,功能齐全,产品化程度高,可本地化部署。有需要的可以联系我。

  4. ETC快递客服智能机器系统架构分享

    作者:bait 1. 系统架构 2. 使用到的技术 目前使用到的技术有springboot作为后端开发,vue.avue.element ui组建作为前端开发框架.相关业务的通讯解耦采用了rabbit ...

  5. 首汽约车携手AWS,发布出行行业首个定制智能语音解决方案

    首汽约车与亚马逊云服务AWS联合宣布,基于AWS机器学习服务Amazon SageMaker和Amazon Transcribe开发的出行行业首个定制智能语音解决方案正式上线. 基于该解决方案,首汽约 ...

  6. 可信AI年度观察 | 智能语音产业需求不断升级,评测重点由技术转向产品

    自<新一代人工智能发展规划>发布以来,人工智能发展已上升为国家战略,在"十四五"规划中,更是将人工智能列为科技前沿领域的"最高优先级",国家政策支持 ...

  7. 银行在“智能客服”时代都有哪些创新应用?

    如今,无论我们使用银行的APP或是拨打银行客服电话,都会感受到智能化为银行服务形式带来的巨大变化. <中国银行业客服中心与远程银行发展报告(2018)>中指出,2018年,银行业客服中心的 ...

  8. 市场占比 44%,IDC 最新报告:阿里云智能语音市场排名第一

    编辑 | Aholiab 出品 | CSDN(CSDNnews) 近期,权威调研机构IDC发布了<中国AI云服务市场半年度研究报告>,就国内主要云厂商的云上AI服务进行了调研,包括人脸人体 ...

  9. 全球及中国智能语音行业应用趋势及发展方向研究报告2021-2027年

    全球及中国智能语音行业应用趋势及发展方向研究报告2021-2027年 HS--HS--HS--HS--HS--HS--HS--HS--HS--HS--HS--HS--HS--HS--HS--HS--H ...

最新文章

  1. Fence Repair POJ - 3253
  2. [html] 说说你对abbr标签的理解,它有什么含义?
  3. spring security 认证与权限控制
  4. 隐藏文件或文件夹属性无法修改解决方案
  5. 判决素数个数(信息学奥赛一本通-T1409)
  6. 【转载】Objective-C runtime 消息机制
  7. (十六)K-Means聚类
  8. BIO、NIO、AIO差别
  9. No OraCM running
  10. python实现word文档合并
  11. 用java开发一个简单的安卓程序,Android NDK开发简单程序分享(Hello Word!)
  12. 关于软件界面设计、控件颜色搭配、一些实用建议(偷懒技巧)总结——针对C# WinForm/WPF技术
  13. 迭代次数和熵之间关系的一点联想
  14. Taurus_Linux
  15. 如何备战 CCNP 考试
  16. Java8两个list集合合并成一个list集合
  17. itpub上的ORACLE之常用FAQ V1.0(转)
  18. CSS奇怪但偶尔实用的技巧
  19. Tomcat启动项目警告: org.apache.jasper.servlet.TldScanner.scanJars 至少有一个JAR被扫描用于TLD但尚未包含TLD
  20. scrapy爬取字幕组今日更新影视-附源码

热门文章

  1. android epub 开源,EPUB SDK
  2. java 8新特性之effectively final
  3. U8g2库支持的屏幕类型总表以及构造器选择
  4. springboot访问页面显示Whitelabel Error Page
  5. UITT 自动跟单系统
  6. linux cp 中文文件名,linux下将中文文件名文件cp到windows目录下后文件名乱码问题的解决...
  7. Mybatis测试运行异常之Type interface com.testmybatis.dao.bill.BillMapper is not known to the MapperRegistry.
  8. 【LTE】Qualcomm LTE Packets log 分析(一)LTE Access Stratum Log Analysis 1_PSS 2_RACH
  9. 目 录 -- 项目管理知识体系指南(PMBOK指南)(第五版)
  10. python判断素数的方法简书_深入浅出RSA在CTF中的攻击套路