语音识别论文:Comparing the Benefit of Synthetic Training Data for Various Automatic Speech Recognition Arc
声明:我主要从事语音合成,对语音识别的学习主要出于兴趣。文章内容摘要如有错误,还望读者指出,共同学习进步。
欢迎关注微信公众号:低调奋进
Comparing the Benefit of Synthetic Training Data for Various Automatic Speech Recognition Architectures
本文2021.04.12号由德国亚琛工业大学计算机科学系发布,主要对比使用TTS合成的数据对不同ASR架构的影响,具体的文章链接
https://arxiv.org/pdf/2104.05379.pdf
内容摘要
就目前的ASR架构,主要分为attention encoder-decoder(AED),connectionist-temporal-classification(CTC)和Hybrid ASR。其中效果最好的还是Hybrid ASR。本文主要使用TTS进行数据增广,使AED的性能逼近Hybrid ASR。
本文是TTS和ASR都使用LibriSpeech-100,合成使用的文本是LibriSpeech-360,具体的结果如table 5所示,主要的结论如下:
1)使用TTS增广数据对AED提升很大,对Hybrid ASR和CTC相对较小;
2)即使使用TTS增光数据,AED还是无法达到Hybrid ASR的性能;
3)虽然TTS数据对Hybrid ASR影响很小,本文使用LibriSpeech-100来训练Hybrid ASR,在干净和噪声数据集上获得了目前WER较好的3.3%/10%的表现。
语音识别论文:Comparing the Benefit of Synthetic Training Data for Various Automatic Speech Recognition Arc相关推荐
- 语音识别(ASR)论文优选:端到端ASR综述Recent Advances in End-to-End Automatic Speech Recognition
声明:平时看些文章做些笔记分享出来,文章中难免存在错误的地方,还望大家海涵.搜集一些资料,方便查阅学习:http://yqli.tech/page/speech.html.语音合成领域论文列表请访问h ...
- SIEVE: Secure In-Vehicle Automatic Speech Recognition Systems 论文报告
一.论文信息 标题:SIEVE: Secure In-Vehicle Automatic Speech Recognition Systems 作者:Shu Wang, Jiahao Cao, Kun ...
- NLP之ASR:语音识别技术(Automatic Speech Recognition)的简介、发展历史、案例应用之详细攻略
NLP之ASR:语音识别技术(Automatic Speech Recognition)的简介.发展历史.案例应用之详细攻略 目录 语音识别技术(Automatic Speech Recognitio ...
- 语音识别(ASR)论文优选:Adapting GPT, GPT-2 and BERT Language Models for Speech Recognition
声明:平时看些文章做些笔记分享出来,文章中难免存在错误的地方,还望大家海涵.平时搜集一些资料,方便查阅学习:http://yqli.tech/page/speech.html.如转载,请标明出处.欢迎 ...
- 语音识别论文.doc
您所在位置:网站首页 > 海量文档  > 幼儿/小学教育 > 幼儿教育 语音识别论文.doc19页 本文档一共被下载: ...
- 【论文学习】《Who is Real Bob? Adversarial Attacks on Speaker Recognition Systems》
<Who is Real Bob? Adversarial Attacks on Speaker Recognition Systems>论文学习 文章目录 <Who is Real ...
- 论文翻译:2022_PACDNN: A phase-aware composite deep neural network for speech enhancement
论文地址:PACDNN:一种用于语音增强的相位感知复合深度神经网络 相似代码:https://github.com/phpstorm1/SE-FCN 引用格式:Hasannezhad M,Yu H,Z ...
- Kaldi学习笔记——The Kaldi Speech Recognition Toolkit(Kaldi语音识别工具箱)(上)
最近看了有关KALDI的论文,在这里介绍一下. Abstract: We describe the design of Kaldi, a free, open-source toolkit for s ...
- 语音识别(Speech recognition)的核心内容是将语音转换成文字
https://www.bilibili.com/video/av16198207?from=search&seid=16570566229872205850 语音识别,又称为自动语音识别(A ...
最新文章
- disk boot failure,insert system disk and press enter
- 【设计模式】业务代表模式
- 新视角来了:《用户体验四维度》
- MRU 列表序列化的 Boost.MultiIndex 示例
- VTK:PolyData之ImplicitPolyDataDistance
- 2019年第十届蓝桥杯 - 省赛 - C/C++大学B组 - H. 等差数列
- html5实现圆圈里带一个三角形,CSS制作箭头图标代码(圆,三角形,椭圆)c
- SqlException (0x80131904): 将截断字符串或二进制数据。
- 谷歌聊天机器人api_如何编写针对Google地图等网络应用量身定制的聊天机器人
- flash.net.filereference php,as3与php 上传单个图片demo
- 连接mysql超过连接次数处理办法
- SQOOP 基础及安装
- Azure: 给 ubuntu 虚机挂载数据盘
- 函数WaitForMultipleObjects
- 超快语义分割 | PP-LiteSeg集速度快、精度高、易部署等优点于一身,必会模型!!!...
- matlab金融时间序列分析,5 个 MATLAB 金融时序预测速查表
- GAN生成图像质量的两个评价指标——IS与FID
- L4RE学习笔记——服务介绍
- 可能改变前端工程化未来的特性:ESM Loader Hooks
- java无法验证证书_如何解决“证书无效,不能用于验证本网站的身份”错误?...