乾明 发自 凹非寺
量子位 报道 | 公众号 QbitAI

没错,阿里并非先发的语音AI,现在中国市场份额第一。

7月14日(周二),IDC发布《中国AI云服务市场半年度研究报告》显示,阿里语音AI以44%的市场份额,超过百度云、腾讯云、华为云、AWS、微软Azure等云服务厂商,成为第一。

从IDC报告的具体内容来看,阿里语音AI这个No.1,得益于其在智能语音、对话式AI、机器学习三大领域的实力:

智能语音领域产品数量、市场份额、API调用量三项第一;对话式AI领域市场份额、API调用量两项第一;机器学习领域获得市场份额第一。

这还只是现状。

IDC还预测,2020年中国人工智能市场规模将会接近20亿美元,巨大的市场规模,作为市场领导者,阿里将会有更多的表现空间。

然而,对于这样的一份成绩单,阿里巴巴达摩院语音实验室负责人鄢志杰,并不“感冒”。

在他看来,IDC报告中的数字并不重要,更值得关注的是背后的趋势:语音AI技术的商业价值,已经在市场上得到了初步体现。

他说,阿里巴巴之所以有这样的成绩,不仅仅有过去5、6年时间的技术积累为基础,还在于AI上云的过程中,找到了“落地”秘诀。

中国No.1的语音AI,如何后发先至?

相比90时代就搞语音的玩家,阿里的语音AI之路,不算早。

阿里开始大力度、严肃地研发语音AI技术,起于2014年底,标志性事件是“神秘部门”iDST(数据科学与技术研究院)成立。

在此之前,相关的研究只是零散地分布在各个业务线之中。

2015年,鄢志杰在微软亚洲研究院工作7年后,加入阿里iDST,负责语音技术的研发工作。

当时,语音AI技术主要用于阿里内部业务,比如淘宝、天猫的等电商体系客服中心的需求。

因为之前没有研究积累,鄢志杰需要带队从0到1,为阿里打造一个能用、好用的语音AI系统。

虽然困难,但也好在没有“历史包袱”,他可以放开手去做。

在阿里丰富的应用场景下,阿里语音AI的后发优势显现出来。

比如2016年开始备受关注的latency-controlled BLSTM(LC-BLSTM) 模型,从学界到阿里率先实现落地,只用了几个月的时间。

而且不仅仅只有单纯的落地,还有面向应用的优化。

在阿里版本的LC-BLSTM模型中,不仅降低了传统BLSTM模型延迟严重的问题,精度同样不差。

相关论文也得到了学术界的认可,在2017年经过同行评审,发表在了IEEE旗下ICASSP(声学语音和信号处理国际会议)上。

之后,阿里语音AI进一步发展,不断涌现出新的研究成果,被ICASSP、DSP等语音领域国际顶尖会议收录。

2019年2月28日,MIT将阿里巴巴语音AI技术评为2019年“全球十大突破性技术”。

MIT认为,阿里巴巴已拥有比谷歌更好的AI语音技术,可以完成复杂的人类对话功能,甚至可读懂人类的潜在意图。

阿里巴巴也是唯一上榜的中国科技公司,其他的突破技术分别是“肠道显微胶囊”、“定制癌症疫苗”、“人造肉汉堡”、“可穿戴心电仪”、“无下水道卫生间”等等。

突破仍在继续。2019年7月,阿里发布新一代语音合成技术KAN-TTS,首次将该数字提高到97%以上。

阿里达摩院介绍,KAN-TTS已经实现主流场景风格声音的全覆盖,可针对通用场景、客服场景、童声场景、英文场景和方言场景,提供41种高品质的声音,例如温柔、甜蜜、严厉等风格。

而且还具备多方言、重口音语音识别,全双工语音交互,智能语音流式响应等技术能力。

鄢志杰说,它已经能够实现拟人程度更高的交互效果,整个过程几乎听不出是AI在跟人交互。

想要推动技术落地,技术强是根本,但找到商业价值和模式更加重要。

在鄢志杰看来,这是阿里语音AI技术发展到现在最难的一个点,也是其能够得到市场认可的关键。

自学习,阿里语音AI的落地秘诀

2017年初,阿里开始推动AI技术上云对外输出,语音AI作为阿里内部广泛应用且成熟的技术,成为“先锋”。

语音AI上云后,阿里对外输出的第一个项目,是为浙江高院提供庭审速记能力。

拿下行业头部用户,是推动AI技术落地时最常用的一种手段。

其不仅能够产生“标杆效应”,吸引更多的人采用技术,而且还能在这个过程中,快速汲取行业Know—How,来完善技术方案,更好地复制到其他相似场景中。

目前,阿里智能庭审语音识别覆盖超过全国20个省的8000间线下法院,覆盖率近50%。互联网庭审覆盖15000余间线上法庭,覆盖率超过90%。

IDC报告也给出了分析称,通过前期的行业布局,阿里云在法院、呼叫中心、电信运营商领域的客户认知度也处于第一位,领先其它云服务厂商。

不过,这样的AI落地模式也存在弊端——依赖项目推进,不仅需要大量的人力资源,效率并不高。

如何找到一种更高效的落地方式,是整个行业都面临的挑战。

同样是在2017年,阿里语音AI团队在与客户共创的时候受到启发,基于“定制AI”打造出了语音自学习平台,面向没有技术研发实力的客户提供语音原子能力、行业模型等服务。

鄢志杰将其形容为“傻瓜相机”式的产品。

阿里提供针对声学模型和语言学模型的定制训练流程,用户在安全环境中灌注行业数据,可以在完全不了解语音语言算法的情况下,快速、便捷地定制自己的语音模型。

在落地过程中,也展现出了效力。比如疫情期间,湖北的智能疫情机器人使用阿里语音AI自学习平台,湖北口音语音识别率从62.5%提升至94.4%。

IDC在报告中总结称,语音语义领域,用户重视的是服务,能不能满足客户的个性化需求十分重要。

阿里语音AI能够实现大面积落地,在法院、呼叫中心、电信运营商领域的客户认知度处于第一位,拥有教育、金融、互联网、交通、餐饮、通信、医疗等各行各业5万家客户,秘诀正在于此。

现在,鄢志杰正在致力于将语音AI技术拓展到更多的场景中,供给无处不在的智能语音。

在他看来,整个语音AI的价值才刚刚开始呈现,市场还处于早期发展阶段,未来将会有更大的发挥空间和价值。

比如,如果在强噪音、多人交互的情况下,实现更高准确率的识别,比如语音和NLP技术的结合,实现语音翻译、语音摘要技术等等。

而且随着新基建机遇到来,语音AI与云结合,还会有更大的前景。

被集成,阿里的“基建式”打法

2020年4月20日,阿里云宣布未来3年规划:再投2000亿,用于云操作系统、服务器、芯片、网络等重大核心技术研发攻坚和面向未来的数据中心建设。

阿里到底如何做?具体做什么?想要达到什么样的效果?阿里语音AI无疑给出了直观体现。

一方面基于阿里达摩院,从未来商业价值出发,提升技术层面上的能力,进行前瞻性研发布局。

另一方面在于阿里云平台的能力建设,供应更强的算力,为技术对外输出提供坚实支撑。

再往底层芯片上面,平头哥也在积极布局,前不久已经实现含光800商用,通过阿里云对外输出。

……

一系列动作背后,也不难发现阿里的目标所向——打造基础设施,供应给有需求的客户,甘愿被集成,帮助他们来打造成落地的应用,服务更多人。

鄢志杰说,阿里内部有一个口号是“达摩院技术零时差上云”。阿里语音AI技术,就是其交出的答卷之一。

1999年,阿里巴巴在杭州成立之时,定下了公司的使命:让天下没有难做的生意。

这也成为了阿里孵化出淘宝、支付宝、天猫、菜鸟等等一系列产品的出发点,打造出了辐射数亿人的阿里经济体。

现在,经济发展的驱动力逐步发生改变,AI、大数据为核心的新兴技术,在“生意”中变得越来越关键。

阿里巴巴,同样正在用自己的行动践行使命:让天下没有难得到的技术。

本文系网易新闻•网易号特色内容激励计划签约账号【量子位】原创内容,未经账号授权,禁止随意转载。

了解AI发展现状,抓住行业发展机遇

如何关注、学习、用好人工智能?

每个工作日,量子位AI内参精选全球科技和研究最新动态,汇总新技术、新产品和新应用,梳理当日最热行业趋势和政策,搜索有价值的论文、教程、研究等。

同时,AI内参群为大家提供了交流和分享的平台,更好地满足大家获取AI资讯、学习AI技术的需求。扫码即可订阅:

AI社群 | 与优秀的人交流

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

喜欢就点「在看」吧 !

IDC最新报告:阿里语音AI登顶中国No.1相关推荐

  1. 市场占比 44%,IDC 最新报告:阿里云智能语音市场排名第一

    编辑 | Aholiab 出品 | CSDN(CSDNnews) 近期,权威调研机构IDC发布了<中国AI云服务市场半年度研究报告>,就国内主要云厂商的云上AI服务进行了调研,包括人脸人体 ...

  2. 百度宣布AI语音调用登顶中国第一,自研芯片+最新端到端模型颠覆传统语音识别算法...

    晓查 发自 凹非寺 量子位 报道 | 公众号 QbitAI 2019年,NLP和语音技术取得了多项技术突破,但是科技公司考虑更多的是AI的"场景",如何在各种场景中都能方便地集成语 ...

  3. 周博通 | 阿里语音AI入选MIT“全球十大突破技术”;阿里云率先达成国家绿色数据中心标准;iOS协程开发框架coobjc开源...

    阿里妹导读:雪融化了,春天还会远吗? 天气渐暖,"惊蛰"将至,春雷渐来,冬眠的动物们也将陆续活动开,年后第一期的周博通也整装再发.重新上线啦,希望你会喜欢. 周 博 通 中国唯一上 ...

  4. 英国最新报告:40% AI公司其实没用任何AI技术

    https://www.toutiao.com/a6665966513943478796/ [新智元导读]一份2019最新AI行业报告显示,仅在欧洲,就有40%的AI公司,背后并没有任何AI相关的技术 ...

  5. 国际研究机构:阿里巴巴语音AI中国第一

    7月14日,国际权威研究机构IDC(国际数据公司)公布<中国AI云服务市场半年度研究报告,2019H2>,阿里语音AI表现突出,2019年以44%的市场份额稳居第一位,大幅领先国内其他云服 ...

  6. 一个阿里云语音AI都无法处理的英语单词

    近期做一个项目时因为要使用语音合成技术,之前使用百度的语音合成,虽然免费,但是效果不理想,没法达到相应要求.有一个神奇的事情是,百度翻译的AI能读准这个单词,但是免费提供的语音合成接口发音有错误的. ...

  7. IDC 中国边缘云市场最新报告解读:阿里云蝉联中国公有云市场第一

    国际权威咨询公司IDC发布<中国边缘云市场解读(2022 )>报告,中国边缘公有云服务市场,阿里云蝉联第一. 市场蝉联第一,"边缘"生长强劲 近期,全球领先的IT市场研 ...

  8. 最新剑桥《AI全景报告》出炉:中国发表机器学习学术研究超过美国

    来源 | 转载自新智元(ID:AI_era) 2019年即将过去一半,剑桥大学的两位研究人员近日推出了本年度的State AI 2019全景报告. 本报告基本沿袭去年的大体框架,从产业.人才.政策.预 ...

  9. IDC最新数据库报告:阿里云份额跃居第一 首次超越传统数据库

    IDC最新数据库报告:阿里云份额跃居第一 首次超越传统数据库 日前,全球知名市场调研机构IDC 公布了的2019年下半年中国关系型数据库市场厂商份额数据.报告显示,在公有云模式中,阿里云市场份额达50 ...

最新文章

  1. 分类家族:二分类、多分类、多标签分类、多输出分类
  2. HDU 4166 BNU 32715 Robot Navigation (记忆化bfs)
  3. 运算符中,优先级高低总结。
  4. Android中通过Java代码实现ScrollView滚动视图-以歌词滚动为例
  5. 给Vista系统加入一键还原功能
  6. kafka中topic默认属性_分享:Kafka 的 Lag 计算误区及正确实现
  7. wget抓取网站, 模拟手机端抓取
  8. 协鑫集成等四家公司被退出欧盟MIP协议
  9. 如何解决xp进系统的时候需要按enter键
  10. python计算器_python_计算器
  11. 备忘录:XCode配置
  12. www.lthack.com php,[经验谈] PHP漏洞全解 ---文章转载自(十八哥,自学it网_公益IT培训)...
  13. LOJ2312 LUOGU-P3733「HAOI2017」八纵八横 (异或线性基、生成树、线段树分治)
  14. db2 前滚数据库_db2 前滚会话
  15. 关于我本人阳了个阳一事
  16. C语言程序设计 现代方法(第2版)pdf
  17. 有理数加法 (15 分)
  18. saas系统的微服务器,基于微服务架构的SaaS服务应用的研究与实践
  19. 多的是,你不知道的“浮点数”
  20. 查询快递物流提前签收的单号,快速分析筛选的方法

热门文章

  1. 【IOS】获取顶层UIViewController
  2. 3.1线性判别函数【模式识别】
  3. fastDFS安装及配置
  4. IIS 500错误报service unavailable解决方案之一
  5. 分配性质是什么意思_苏教版六年级数学上册3.9按比分配问题(1)微课视频 | 练习...
  6. Maltego更新到4.2.6
  7. 无线网络实体图生成工具airgraph-ng
  8. Xamarin Android项目真机测试闪退
  9. 西部数码虚拟主机服务器配置,西部数码虚拟主机设置首页功能介绍
  10. java接口测试工具_接口测试基础了解篇