语音识别论文：Comparing the Benefit of Synthetic Training Data for Various Automatic Speech Recognition Arc

声明：我主要从事语音合成，对语音识别的学习主要出于兴趣。文章内容摘要如有错误，还望读者指出，共同学习进步。

欢迎关注微信公众号：低调奋进

Comparing the Benefit of Synthetic Training Data for Various Automatic Speech Recognition Architectures

本文2021.04.12号由德国亚琛工业大学计算机科学系发布，主要对比使用TTS合成的数据对不同ASR架构的影响，具体的文章链接

https://arxiv.org/pdf/2104.05379.pdf

内容摘要

就目前的ASR架构，主要分为attention encoder-decoder(AED)，connectionist-temporal-classification(CTC)和Hybrid ASR。其中效果最好的还是Hybrid ASR。本文主要使用TTS进行数据增广，使AED的性能逼近Hybrid ASR。

本文是TTS和ASR都使用LibriSpeech-100，合成使用的文本是LibriSpeech-360，具体的结果如table 5所示，主要的结论如下：

1）使用TTS增广数据对AED提升很大，对Hybrid ASR和CTC相对较小；

2）即使使用TTS增光数据，AED还是无法达到Hybrid ASR的性能；

3）虽然TTS数据对Hybrid ASR影响很小，本文使用LibriSpeech-100来训练Hybrid ASR，在干净和噪声数据集上获得了目前WER较好的3.3%/10%的表现。

语音识别论文：Comparing the Benefit of Synthetic Training Data for Various Automatic Speech Recognition Arc相关推荐

语音识别(ASR)论文优选：端到端ASR综述Recent Advances in End-to-End Automatic Speech Recognition
声明:平时看些文章做些笔记分享出来,文章中难免存在错误的地方,还望大家海涵.搜集一些资料,方便查阅学习:http://yqli.tech/page/speech.html.语音合成领域论文列表请访问h ...
SIEVE: Secure In-Vehicle Automatic Speech Recognition Systems 论文报告
一.论文信息标题:SIEVE: Secure In-Vehicle Automatic Speech Recognition Systems 作者:Shu Wang, Jiahao Cao, Kun ...
NLP之ASR：语音识别技术(Automatic Speech Recognition)的简介、发展历史、案例应用之详细攻略
NLP之ASR:语音识别技术(Automatic Speech Recognition)的简介.发展历史.案例应用之详细攻略目录语音识别技术(Automatic Speech Recognitio ...
语音识别(ASR)论文优选：Adapting GPT, GPT-2 and BERT Language Models for Speech Recognition
声明:平时看些文章做些笔记分享出来,文章中难免存在错误的地方,还望大家海涵.平时搜集一些资料,方便查阅学习:http://yqli.tech/page/speech.html.如转载,请标明出处.欢迎 ...
语音识别论文.doc
您所在位置:网站首页 > 海量文档 &nbsp>&nbsp幼儿/小学教育&nbsp>&nbsp幼儿教育语音识别论文.doc19页本文档一共被下载: ...
【论文学习】《Who is Real Bob? Adversarial Attacks on Speaker Recognition Systems》
<Who is Real Bob? Adversarial Attacks on Speaker Recognition Systems>论文学习文章目录 <Who is Real ...
论文翻译：2022_PACDNN: A phase-aware composite deep neural network for speech enhancement
论文地址:PACDNN:一种用于语音增强的相位感知复合深度神经网络相似代码:https://github.com/phpstorm1/SE-FCN 引用格式:Hasannezhad M,Yu H,Z ...
Kaldi学习笔记——The Kaldi Speech Recognition Toolkit（Kaldi语音识别工具箱）（上）
最近看了有关KALDI的论文,在这里介绍一下. Abstract: We describe the design of Kaldi, a free, open-source toolkit for s ...
语音识别(Speech recognition)的核心内容是将语音转换成文字
https://www.bilibili.com/video/av16198207?from=search&seid=16570566229872205850 语音识别,又称为自动语音识别(A ...

语音识别论文：Comparing the Benefit of Synthetic Training Data for Various Automatic Speech Recognition Arc

语音识别论文：Comparing the Benefit of Synthetic Training Data for Various Automatic Speech Recognition Arc相关推荐

最新文章

热门文章