原标题:微软语音识别技术屡破世界纪录的秘密都在这里了

丹棱君有话说:还记得 2016 年 10 月 18 日吗?那一天,微软语音团队在 Switchboard 语音识别基准测试中了刷新自己的纪录,词错率低至 5.9%,达到了人类的水平。306 天后,2017 年 8 月 20 日,这一纪录再次被微软刷新,Switchboard 词错率从 5.9% 降低到 5.1%,成为行业新的标杆。想知道标杆是怎样炼成的吗?且听丹棱君为大家揭晓~

8 月 20 日,微软语音和对话研究团队负责人黄学东宣布微软语音识别系统继微软对话语音识别技术达至人类专业水平,开启人工智能新征程之后再次取得重大突破,错误率由 5.9% 进一步降低到 5.1%,可与专业速记员比肩。此次突破大幅刷新原先记录,并在语音识别行业树立新的里程碑。

在微软转录系统达到 5.9% 的错误率之后,其他研究人员在此基础上分别进行研究,采用了更多参与的多转录程序,成功在语音识别准确性道路上更进一步。

这两次研究转录的都是 Switchboard 语料库中的录音,Switchboard 是一个电话通话录音语料库,自上世纪 90 年代以来一直被研究人员作为测试语音识别系统的样本。语音识别测试任务包括对陌生人对话交流中的不同话题,比如体育和政治方面的讨论,进行从语音到文字的转录。

研究人员通过改进微软语音识别系统中基于神经网络的听觉和语言模型,在去年基础上降低了大约 12% 的出错率,同时引入了 CNN - BLSTM(convolutional neural network combined with bidirectional long-short-term memory,带有双向 LSTM 的卷积神经网络)模型,用于提升语音建模的效果。并且,系统中以前就在使用的从多个语音模型进行综合预测的方法,如今在帧 / 句音级别和单词级别下都可以发挥效果。

除此以外,研究人员还对整个对话过程进行历史记录分析,预测接下来可能会发生的事情,进一步加强识别器的语言模型,使其能够有效适应对话话题和语境的快速转变。

微软认知工具包 Microsoft Cognitive Toolkit 2.1(CNTK)在研究过程中表现突出,研究人员充分利用 CNTK 探索模型架构和优化模型的超参数。此外,微软对云计算基础设施(特别是 Azure GPU)的投资,也帮助提升了训练模型、测试新想法的效果和速度。

实现识别准确率上的“人类对等”是语音识别领域过去 25 年来一直奋力追求的研究目标,微软始终坚持深耕语音识别,并力争将新技术最快、最好地运用到Cortana 、Presentation Translator 、Microsoft Cognitive Services 等微软产品和服务中,让用户能够亲身体验新技术的魅力。微软的研究团队非常高兴可以看到每天有数百万的用户在使用这些产品,未来将更加努力,创造出更具突破性的工作成果。

Presentation Translator:利用语音识别实现多语言观众实时翻译演示文稿

在语音识别领域,业界和学术界有许多研究团队都有重大进展,微软研究团队在行业的整体发展下同样获益良多。尽管目前在 Switchboard 语音识别任务中实现了 5.1% 的低错误率,事实上语音研究领域仍然挑战重重,例如嘈杂环境、录音距离较远场景下的语音识别,方言识别,有限训练数据条件下的语音识别或较少人使用的语言的语音识别,这些距离达到人类相近水平还相差甚远。而且,计算机学会将语音转换为文字并非语音识别的终点,让计算机能够理解其中的含义和目的才是道阻且长。从语音识别到话语理解,将会是语音相关技术的下一个重要前沿。

https://www.microsoft.com/en-us/research/publication/microsoft-2017-conversational-speech-recognition-system/

点击链接,即可下载 “The Microsoft 2017 Conversational Speech Recognition System” 论文原文。返回搜狐,查看更多

责任编辑:

微软语音识别技术屡破世界纪录的秘密都在这里了相关推荐

  1. 燃!阿里技术又破世界纪录:机器阅读理解力首次超过人类!

    2018年伊始,人工智能取得重大突破!1月11日,由斯坦福大学发起的机器阅读理解领域顶级赛事SQuAD刷新排名,令业界振奋的是人工智能的阅读能力历史上首次超越人类.阿里巴巴凭借82.440的精准率打破 ...

  2. 人工机器:NDC-谷歌机器翻译破世界纪录,仅用Attention模型,无需CNN和RNN

    终于找到ML日报的微信链接,抄之...................................... 请拜访原文链接:[谷歌机器翻译破世界纪录]仅用Attention模型,无需CNN和RNN. ...

  3. 分享|破世界纪录的OceanBase,如今入选了国际顶会VLDB 2022

    *本文转载自微信公众号"机器之心(ID:almosthuman2014),原文<破世界纪录的国产数据库OceanBase,如今入选了国际顶会VLDB 2022>" 近年 ...

  4. 重磅!浙大博士两破世界纪录,三年两获浙大竺可桢奖学金!

    点上方蓝字计算机视觉联盟获取更多干货 在右上方 ··· 设为星标 ★,与你不见不散 编辑:Sophia 计算机视觉联盟  报道  | 公众号 CVLianMeng 转载于 :浙江大学,钱江晚报 AI博 ...

  5. 服务器 amd cpu性能排行榜,AMD霸榜,桌面端移动端服务器端全面领先!最强CPU性能破世界纪录...

    "AMD Yes!"这句口号继续有效,AMD全面霸占CPU性能排行榜,桌面端移动端服务器端全面领先! 最近几年,Intel的CPU不给力,看来能打败AMD CPU的只有它自己. 在 ...

  6. 斯坦福AI 5小时DNA测序破世界纪录!创人类新里程碑,成本仅3万

      视学算法报道   编辑:桃子 袁榭 拉燕 [新智元导读]近日,斯坦福大学研究团队把人类DNA测序的时间缩短至5小时2分钟,重新定义了人类基因组测序速度! DNA测序时间减半,还创下了最新吉尼斯世界 ...

  7. 把「光」存储1小时,中科大新研究破世界纪录,保真度高达96.4% | Nature子刊

    萧箫 发自 凹非寺 量子位 报道 | 公众号 QbitAI 把光"封印"1小时,放出来后还是"活"的,这可能吗? 现在,来自中科大的郭光灿院士团队真的做到了. ...

  8. HTML易烊千玺网页,易烊千玺弟弟破世界纪录,被扒两天就被人打破,认证网站遭质疑...

    近日,世界纪录认证WRCA网站宣布易烊千玺的弟弟易烊昱华成功创造了一个新的世界纪录.在今年八月,易烊昱华以1分50秒66的成绩完成了2个二阶魔方的还原,是世界上完成这个挑战的最小年龄纪录保持者.易烊千 ...

  9. Python实现自动扫雷,轻松挤上世界排行榜,破世界纪录~

    导语: 对于许多90后.00后来说,扫雷这个电脑上自带的小游戏早就变成古早的历史,再一次提到扫雷这个名字的时候,对许多人来说,仿佛就是上世纪的事情了 扫雷 就像是偶尔点开微信的跳一跳小游戏,发现排行榜 ...

最新文章

  1. Vue实现禁止链接打开
  2. 一文看懂卷积神经网络CNN的核心
  3. 让初学者不迷茫的Java学习方法有很多?
  4. 利用python做一个小游戏_如何使用python做一个简单的猜数字的小游戏
  5. trang.jar转换xml到Javabean
  6. 中国大妈也不带钱包了!支付宝春节60后境外支付人数增长130%
  7. android sendmessage和post的区别,Handler的sendMessage和postDelay的区别
  8. Python+Opencv图像处理新手入门教程(四):视频内容的读取与导出
  9. java+cache使用方法_JVM代码缓存区CodeCache原理及用法解析
  10. ei指什么_SCI、EI、ISTP国际三大检索分别指的是什么-百度经验
  11. 阿里云商标自助注册申请快速入门(详细步骤和教程)
  12. Win10删除微软拼音输入法
  13. 手机感应器,方向东南西北指南针,前后左右旋转角度。
  14. Deepin双系统找不到Windows启动项
  15. SQL高级教程(三十)- - SQL NULL 函数
  16. 液晶屏常见问题_如何解决液晶显示器最常见的问题
  17. PHP有哪些优势和劣势
  18. 层次分析法——python
  19. [转]OpenResty的现状、趋势、使用及学习方法
  20. 关于公钥、私钥和 CA 认证的小故事

热门文章

  1. 虚拟机virtualBox
  2. Unix/Linux Command Reference
  3. 《DSP using MATLAB》示例Example 8.5
  4. PTA 5-10 Saving James Bond-Easy (25) - 图 - DFS
  5. Leetcode:Pow(x,n)
  6. LINUX环境并发服务器的三种实现模型
  7. UVA11577 Letter Frequency【文本】
  8. POJ3617 Best Cow Line【水题】
  9. math、numpy、pandas NaN 判断
  10. and/or(||)的理解