声明:我主要从事语音合成,对语音识别的学习主要出于兴趣。文章内容摘要如有错误,还望读者指出,共同​学习进步。

欢迎关注微信公众号:低调奋进


Comparing the Benefit of Synthetic Training Data for Various Automatic Speech Recognition Architectures

本文2021.04.12号由德国亚琛工业大学计算机科学系发布,主要对比使用TTS合成的数据对不同ASR架构的影响,具体的文章链接

https://arxiv.org/pdf/2104.05379.pdf


内容摘要

就目前的ASR架构,主要分为attention encoder-decoder(AED),connectionist-temporal-classification(CTC)和Hybrid ASR​。其中效果最好的还是Hybrid ASR​。本文主要使用TTS进行数据增广,使AED的性能逼近Hybrid ASR​。

本文是TTS和ASR都使用LibriSpeech-100,合成使用的文本是LibriSpeech-360,具体的结果如table 5​所示,主要的结论如下:

1)使用TTS增广数据对AED提升很大,对Hybrid ASR和CTC​相对较小;

2)即使使用TTS增光数据,AED还是无法达到Hybrid ASR的性能;

3)虽然TTS数据对Hybrid ASR影响很小,本文使用LibriSpeech-100来训练Hybrid ASR,在干净和噪声数据集上获得了目前WER较好的3.3%/10%的表现。

语音识别论文:Comparing the Benefit of Synthetic Training Data for Various Automatic Speech Recognition Arc相关推荐

  1. 语音识别(ASR)论文优选:端到端ASR综述Recent Advances in End-to-End Automatic Speech Recognition

    声明:平时看些文章做些笔记分享出来,文章中难免存在错误的地方,还望大家海涵.搜集一些资料,方便查阅学习:http://yqli.tech/page/speech.html.语音合成领域论文列表请访问h ...

  2. SIEVE: Secure In-Vehicle Automatic Speech Recognition Systems 论文报告

    一.论文信息 标题:SIEVE: Secure In-Vehicle Automatic Speech Recognition Systems 作者:Shu Wang, Jiahao Cao, Kun ...

  3. NLP之ASR:语音识别技术(Automatic Speech Recognition)的简介、发展历史、案例应用之详细攻略

    NLP之ASR:语音识别技术(Automatic Speech Recognition)的简介.发展历史.案例应用之详细攻略 目录 语音识别技术(Automatic Speech Recognitio ...

  4. 语音识别(ASR)论文优选:Adapting GPT, GPT-2 and BERT Language Models for Speech Recognition

    声明:平时看些文章做些笔记分享出来,文章中难免存在错误的地方,还望大家海涵.平时搜集一些资料,方便查阅学习:http://yqli.tech/page/speech.html.如转载,请标明出处.欢迎 ...

  5. 语音识别论文.doc

    您所在位置:网站首页 > 海量文档 &nbsp>&nbsp幼儿/小学教育&nbsp>&nbsp幼儿教育 语音识别论文.doc19页 本文档一共被下载: ...

  6. 【论文学习】《Who is Real Bob? Adversarial Attacks on Speaker Recognition Systems》

    <Who is Real Bob? Adversarial Attacks on Speaker Recognition Systems>论文学习 文章目录 <Who is Real ...

  7. 论文翻译:2022_PACDNN: A phase-aware composite deep neural network for speech enhancement

    论文地址:PACDNN:一种用于语音增强的相位感知复合深度神经网络 相似代码:https://github.com/phpstorm1/SE-FCN 引用格式:Hasannezhad M,Yu H,Z ...

  8. Kaldi学习笔记——The Kaldi Speech Recognition Toolkit(Kaldi语音识别工具箱)(上)

    最近看了有关KALDI的论文,在这里介绍一下. Abstract: We describe the design of Kaldi, a free, open-source toolkit for s ...

  9. 语音识别(Speech recognition)的核心内容是将语音转换成文字

    https://www.bilibili.com/video/av16198207?from=search&seid=16570566229872205850 语音识别,又称为自动语音识别(A ...

最新文章

  1. disk boot failure,insert system disk and press enter
  2. 【设计模式】业务代表模式
  3. 新视角来了:《用户体验四维度》
  4. MRU 列表序列化的 Boost.MultiIndex 示例
  5. VTK:PolyData之ImplicitPolyDataDistance
  6. 2019年第十届蓝桥杯 - 省赛 - C/C++大学B组 - H. 等差数列
  7. html5实现圆圈里带一个三角形,CSS制作箭头图标代码(圆,三角形,椭圆)c
  8. SqlException (0x80131904): 将截断字符串或二进制数据。
  9. 谷歌聊天机器人api_如何编写针对Google地图等网络应用量身定制的聊天机器人
  10. flash.net.filereference php,as3与php 上传单个图片demo
  11. 连接mysql超过连接次数处理办法
  12. SQOOP 基础及安装
  13. Azure: 给 ubuntu 虚机挂载数据盘
  14. 函数WaitForMultipleObjects
  15. 超快语义分割 | PP-LiteSeg集速度快、精度高、易部署等优点于一身,必会模型!!!...
  16. matlab金融时间序列分析,5 个 MATLAB 金融时序预测速查表
  17. GAN生成图像质量的两个评价指标——IS与FID
  18. L4RE学习笔记——服务介绍
  19. 可能改变前端工程化未来的特性:ESM Loader Hooks
  20. java无法验证证书_如何解决“证书无效,不能用于验证本网站的身份”错误?...

热门文章

  1. win10操作系统创建局域网共享文件夹
  2. 计算机内存条如何区分频率,怎么看内存条频率,详细教您怎么看内存条频率
  3. 蓝牙打印机PHP代码,小程序调用蓝牙打印机完整代码
  4. 如虎添翼 7 个转场技巧
  5. 重学JavaWeb —— JSP,简单全面一发入魂
  6. day64 url用法以及django的路由系统
  7. Codeforces - Reachable Strings
  8. 用VScode搭建uni-app项目(较全)
  9. 抢红包: 红包过期失效案例
  10. idea怎么进行c语言编程_idea编写c语言