亚马逊的人工智能将实时语音识别错误率降低了6.2%
据 Loup Ventures 不久前发布的2019年语音助理智商测试的结果,通过对每个人工智能系统的800个相同问题的测试,谷歌助手再次引领了这一潮流,与去年一样,100%完全理解了被问到的问题,并正确回答了其中的92.9%,比去年的85.5%的正确率要高。
相比之下,苹果的Siri在理解水平和正确回答水平这两方面的能力也都有提升,从去年的99%理解水平上升到今年的99.8%,同时在正确回答水平方面,从78.5%上升到2019年的83.1%。
尽管亚马逊的Alexa再次位居第三,但今年也算是取得了重大进展,理解了99.9%的问题,并正确回答了79.8%的问题,比去年的Siri表现要好。近日,据外媒报道,亚马逊通过人工智能将实时语音识别错误率降低了6.2%,可以算是一个不小的进步。
据了解,自动语音识别系统是将语音转换为文本,如Alexa的核心系统,其中一个组件是一个模型,它预测哪个单词将出现在一系列单词之后。它们通常是基于n-gram语言模型,这意味着它们可以算出给定过去n-1个单词的下一个单词出现的概率。N-Gram是基于一个假设:第n个词出现与前n-1个词相关,而与其他任何词不相关。(这也是隐马尔可夫当中的假设)整个句子出现的概率就等于各个词出现的概率乘积,各个词的概率可以通过语料中统计计算得到。
但是,像递归神经网络这样的体系结构就比较难以融入实时系统,由于其学习长期依赖关系的能力,通常被用于语音识别,并且常常难以从多个语料库中获取数据。
这就是为什么亚马逊Alexa科研人员要研究能使得这种人工智能模型在语音识别中更实用的技术的原因。
雷锋网了解到,在奥地利格拉茨举行的2019年Interspeech会议上,计划发表的一篇博客和论文《ASR的可伸缩多语料库神经语言模型》中,声称他们可以将单词识别错误率比基线降低6.2%。神经语言模型(NLM)在自动语音识别(ASR)和其他任务中的表现优于传统的N-gram语言模型。然而,要在实际的大规模ASR系统中使用NLM,还需要解决一些挑战。在一些解决方案中,从异源语料库中训练NLM,限制潜伏期影响和处理二次通过重测器中的个性化偏差。
研究人员通过建立领域内和领域外训练数据集的传统模型来解决数据稀缺的问题,这些模型是线性组合的,他们给每个语料库分配了一个分数来衡量其与域内数据的相关性,这决定了为补充数据集选择样本的可能性。
然后他们应用了迁移学习transfer learning,即机器学习的一种,就是把为任务 A 开发的模型作为初始点,重新使用在为任务 B 开发模型的过程中。迁移学习是通过从已学习的相关任务中转移知识来改进学习的新任务,虽然大多数机器学习算法都是为了解决单个任务而设计的,但是促进迁移学习的算法的开发是机器学习人员持续关注的话题。迁移学习对人类来说很常见,例如,我们可能会发现学习识别苹果可能有助于识别梨,或者学习弹奏电子琴可能有助于学习钢琴。
接下来,研究人员将数据通过一个带有n-gram语言模型的语音识别器传递,以使用人工智能模型来改进其预测。为了将传统模型拒绝人工智能模型考虑的假设的风险降到最低,他们使用人工智能模型生成合成数据,为一次通过模型提供训练数据。
训练数据中的样本是成对的词汇,而不是单个词汇,这是一个称为噪声对比估计的方案的一部分,其中一个成对词汇是真正的目标,而另一个词汇是随机选择的。该模型的任务是通过直接估计目标词汇的概率来学习区分。
最后,研究人员量化了人工智能模型的权重,以进一步提高其效率。量化考虑特定变量可以接受的全部值范围,并将其拆分为固定数量的间隔,这样一个间隔内的所有值都近似于一个数字。据研究人员透露,由于量化,人工智能模型在50%的情况下使得语音处理时间增加不超过65毫秒,在90%的情况下增加不超过285毫秒。雷锋网雷锋网(公众号:雷锋网)
雷锋网原创文章,未经授权禁止转载。详情见转载须知。
亚马逊的人工智能将实时语音识别错误率降低了6.2%相关推荐
- 亚马逊推出人工智能咨询服务,机器学习B2B业务又迈出一步
李杉 编译自 TechCrunch 量子位 出品 | 公众号 QbitAI 亚马逊这两天公布了人工智能领域的两项进展. 一是AWS将开设一个名为ML Solutions Lab(机器学习解决方案实验室 ...
- 亚马逊上海人工智能研究院:深度图模型实习生
点上方蓝字计算机视觉联盟获取更多干货 在右上方 ··· 设为星标 ★,与你不见不散 仅作学术分享,不代表本公众号立场,侵权联系删除 转载于:DrugAI AI博士笔记系列推荐 周志华<机器学习& ...
- 【一线】亚马逊AWS首席科学家:语音识别取得突破
文/腾讯<一线>薛芳 2018年1月28日上午,<麻省理工科技评论>新兴科技峰会EmTech China于北京国贸大酒店正式召开,亚马逊AWS首席科学家Animashree A ...
- 亚马逊云人工智能学习
从这个课程可以学习到 什么是人工智能? 为什么Al很重要? 什么是机器学习和深度学习? 亚马逊如何在其产品中使用人工智能 在Aws中提供的支持服务和框架 用例 任何可以感知其环境并相应采取操作的设备都 ...
- 100ms的延迟让亚马逊损失1%销量,如何快速降低网站延迟?
整理 | 郭露 出品 | CSDN(ID:CSDNnews) 当你打开购物网站,你愿意花多久的时间等它加载好所有内容?5秒?10秒?还是20秒?Dynatrace研究表示,大部分人的耐心其实只有3秒钟 ...
- 不止Alexa和AWS,揭秘亚马逊人工智能发展史
来源:腾讯科技 编译:昱烨 亚马逊上周四公布了2017年第四季度财报,盈利接近20亿美元,创下历史纪录. Alexa语音助手和AWS云计算服务是亚马逊业绩的亮点. <连线>杂志近日刊文,介 ...
- 云计算登顶之后,亚马逊人工智能走上新征程
凡是过往,皆为序章. 作者 | 青暮 1961年,人工智能之父.1971年图灵奖获得者John McCarthy在MIT的百周年纪念上,第一次提出了公共计算服务的概念,这其实就是云计算的思想雏形.然而 ...
- 长文丨亚马逊帝国的人工智能革命史
2014年初,Srikanth Thirumalai 见到了亚马逊 CEO Jeff Bezos.Thirumalai 是一位计算机科学家,2005 年从 IBM 来到亚马逊,负责公司的推荐团队.他给 ...
- 市值破7000亿美元 贝索斯成全球新首富,成就亚马逊的正是人工智能
▼ 点击上方蓝字 关注网易智能 聚焦AI,读懂下一个大时代! [网易智能讯 2月5日消息]上周四晚间,亚马逊公布了2017年第四季度以及全年业绩报表,财报中诸多华丽的数字远超华尔街的预测.也正因为如此 ...
最新文章
- 期末复习、化学反应工程科目(第二章)
- hdu5247 找连续数
- 【bug】HbuilderX运行到微信小程序 报错
- 无限场景开放式仿真器 PGDrive:Improving the Generalization of End-to-End Driving through Procedural Generation
- 机器人中的轨迹规划(Trajectory Planning )
- 使用protostuff进行序列化
- 欧洲进出口银行_欧洲对开放银行的推动如何迫使银行应用改善用户体验
- 大脚导入配置选择哪个文件_IntelliJ IDEA详细图解最常用的配置,新人必备
- 1_反向代理【跨域】
- 惊艳!Uber 的豪华开源深度学习“全家桶”
- 教育院校公共机房虚拟桌面解决方案
- linkin大话面向对象--内部类
- php psd图层重命名,ps批量修改图层名字的脚本(附批量替换方法)
- 人类赋予人工智能伦理,生物进化方向的突破是关键【刘锋博士南科大发言】
- mysql开启事务并锁表_MySQL:如何锁定表并启动事务?
- 比赛排行榜如何在LED大屏上实现自动实时滚动播报?
- 58、LVS TUN模型实战
- 传输层协议 ——— UDP协议
- 现代几何学的二十条公理
- StarUML 3.0.2 快速破解方法