在近期举行的Interspeech 2021会议上,主办方开展了“非母语儿童语音识别”的特别会议,并发布专项数据集用于算法评测竞赛,旨在推动非母语儿童语音识别技术的研究。此次竞赛共分为4个细分赛道,网易有道ASR团队斩获其中2项冠军与1项亚军

Interspeech是由国际语音通讯协会(International Speech Communication Association, ISCA)创办的顶级旗舰国际会议,作为全球最大的综合性语音信号处理领域的科技盛会,历届Interspeech会议都备受全球各地语音语言领域人士的广泛关注

当前,自动语音识别(ASR)技术已经在很多场景中得到实际应用,但当应用于特定类型的人群(例如非母语人群和儿童等)的语音数据时,效果仍有较大的可提升空间。

非母语语音中,几种现象会大大降低传统ASR的性能,包括发音错误的单词、不合语法的发音等;儿童语音则由于生理差异(例如较短的声道长度)、认知差异(例如语言习得)和行为差异(例如习惯性低语)等因素,使得其更具挑战。目前也缺乏针对非母语和儿童语音的公开数据库。

虽然面临诸多挑战,但在实际应用中,很多语音数据均来自于非母语人士和儿童,例如语言学习等常见场景。研究针对这两类人群的ASR技术,具有非常大的意义和价值。

网易有道 ASR 团队凭借自身的AI技术能力,结合在线教育真实场景中的多年深耕实践,在此次“Interspeech 2021-非母语儿童语音识别”算法竞赛中取得2项冠军、1项亚军的优异成绩:在英文指定数据集和开放数据集两个赛道中,网易有道均以识别准确率更高获得冠军,并在德语指定数据集赛道中获得第二名。


网易有道ASR团队采用了速度扰动、音量扰动、基频扰动等多种数据增强方法以扩增数据量,减小不同语音音量差异,同时平衡不同年龄段儿童语音数据的基频变化。模型方面采用了传统 Hybrid-NN 模型和端到端 Transformer 模型。其中端到端模型还采用成人数据进行模型预训练,以帮助构建儿童语音识别单元以及训练声学模型。

目前,语音识别技术已经广泛应用于网易有道的众多产品中,如有道词典、有道精品课、有道少儿英语、有道词典笔等,开拓了明星语音、词典笔跟读绘本、语音答题等实际场景中的功能,给用户带来更加便捷、有趣的体验。

未来,网易有道将继续推进语音识别等AI技术的研究,结合在线教育真实场景与用户需求,不断用先进技术提升产品体验,为用户带来更大价值。

- END -

网易有道 ASR 团队斩获 Interspeech 2021 算法竞赛两项冠军相关推荐

  1. 双冠!网易互娱AI Lab包揽NTIRE 2022高动态范围成像(HDR)两项冠军

    点击下方卡片,关注"CVer"公众号 AI/CV重磅干货,第一时间送达 作者:网易互娱 AI Lab 点击进入-> CVer 微信技术交流群 近日网易互娱 AI Lab 获得 ...

  2. 清华大学参赛计算机集群,清华学生超算团队获得国际大学生超级计算机竞赛(SC18)总冠军...

    原标题:清华学生超算团队获得国际大学生超级计算机竞赛(SC18)总冠军 人民网11月16日电 美国当地时间11月15日,2018国际大学生超级计算机竞赛(SC18)在达拉斯落下帷幕,清华大学计算机系超 ...

  3. 腾讯数平团队 荣获第15届国际文档分析与识别竞赛七项冠军

    导语:在刚刚结束的第15届国际文档分析与识别大会(澳大利亚悉尼)上,腾讯数据平台部(下称"数平")团队获颁7项冠军证书,并受邀在会议上做技术分享. 9.20 - 9.25,作为全球 ...

  4. 优秀的高管团队:三个使命、两项任务、四项责任

    企业家一开始创业的时候,需要前进,前进需要的是勇气,而在打造高管团队的过程之中,企业家需要的是后退,后退需要的是智慧. 为了使企业有前途,高管要做哪些事情? 一个企业家应该具备什么样的领导力?以下,E ...

  5. 小米知识图谱团队斩获CCKS 2020实体链指比赛冠军

    "CCKS 2020:面向中文短文本的实体链指任务"是由中国中文信息学会语言与知识计算专业委员会主办,该比赛主要面向中文短文本的实体链指,简称 EL(Entity Linking) ...

  6. 实体list 查找一个符合条件的实体并返回其中一个字段_小米知识图谱团队斩获CCKS 2020实体链指比赛冠军...

    "CCKS 2020:面向中文短文本的实体链指任务"是由中国中文信息学会语言与知识计算专业委员会主办,该比赛主要面向中文短文本的实体链指,简称 EL(Entity Linking) ...

  7. 2021算法竞赛入门班第九节课【线段树】练习题

    题单地址:https://ac.nowcoder.com/acm/problem/collection/1265?asc=true&order=difficulty 目录 情人节的电灯泡[二维 ...

  8. 2021算法竞赛入门班第十节课【字符串】练习题

    目录 救救企鹅[KMP] 救救企鹅[KMP] https://ac.nowcoder.com/acm/problem/20862 KMP匹配,记录匹配的开始下标. #include<bits/s ...

  9. 2021算法竞赛入门班第八节课【数学】习题

    目录) 最大公约数(lcm) [NOIP2011]计算系数[组合数] 大水题[容斥定理] 最大公约数(lcm) https://ac.nowcoder.com/acm/problem/16710 #i ...

  10. 2021算法竞赛入门班第七节课【图论】练习题

    目录 挖沟[最小生成树板子题] 公交线路[最短路板子题] 道路建设[最小生成树] 挖沟[最小生成树板子题] https://ac.nowcoder.com/acm/problem/17509 #inc ...

最新文章

  1. R语言ggplot2可视化自定义图例(legend)方框(box):所有图例没有方框、每个图例分别在不同的方框中、多个图例放置在同一个方框中
  2. 自动驾驶汽车想成为主流?先过了这十二关再说
  3. Android 上滑背景变淡,在Android中,如何平滑地将背景从一种颜色淡化到另一种颜色? (如何使用线程)...
  4. 信息安全工程师笔记-案例分析(一)
  5. 多线程的那点儿事(之无锁链表)
  6. Leetcode 236.二叉树的最近公共祖先
  7. c#命名规范(转载)
  8. 明天开始放假了[2.5-2.13],春节期间计划
  9. 打开Word提示向程序发送命令时出现问题怎么办
  10. Shader山下(六)镜面高光
  11. HttpClient完整使用示例
  12. Room 使用解析(2.4.2 版本)
  13. C语言高一,高一数学上学期的所有知识点
  14. SpringBoot——使用拦截器拦截未登录用户
  15. SLAM总结(二)-数学基础之求导和线性方程求解
  16. 初中数学结合计算机教学设计,依托信息技术进行初中数学教学设计
  17. 支持向量机回归预测SVR——MATLAB超详细代码实现过程
  18. 未曾清贫难成人,不经打击老天真。
  19. 计算机中xp系统中qq文件,WinXP电脑QQ为什么登不上去?如何解决?
  20. Python之——爬取千千静听(百度音乐)歌曲

热门文章

  1. Unity打包exe生成的文件夹合并成单独的exe
  2. Selenium例1: Bing搜索
  3. 搜狗高级测试经理诸葛东明谈基于AI图像识别的输入法性能测试实践
  4. yaml参数文件的使用
  5. 2022-2028年全球与中国细菌生物农药行业市场深度调研及投资预测分析
  6. with admin option和with grant option的区别与用法
  7. 金仓数据库 KingbaseES 插件参考手册 sys_qualstats
  8. 关于博文的禁止评论和允许评论
  9. java 微信群组头像_仿微信生成群组头像
  10. gerrit 用法 topic