文章目录

语音识别常用噪声库和混响库

  1. OPEN SLR17(加性噪声)

这个就是非常出名的MUSAN噪声库,总共约11G,目录包含三个分类:
├── README
├── music
├── noise
├── speech

music中是音乐噪声;
noise包含各种背景噪声;
speech是一些说话人语音;

  • 源openslr链接:http://www.openslr.org/resources/17/musan.tar.gz
  • 国内源链接:https://openslr.magicdatatech.com/resources/17/musan.tar.gz
    (用第二个链接会快一些;)
  1. OPEN SLR28(混响噪声)

这个混响包含了real和simulated,包含不同房间大小的

  • 源openslr链接:http://www.openslr.org/resources/28/rirs_noises.zip
  • 国内源链接:https://openslr.magicdatatech.com/resources/28/rirs_noises.zip

参考链接

  • https://zhuanlan.zhihu.com/p/94273132
  • https://www.zhihu.com/question/278918708/answer/631873989

PS:

  • 可以使用torchaudio.sox_effects改变音速和音量,对语音进行进一步增强;
  • 可以将这两个库作成lmdb库,在语音相关模型训练时进行在线加噪声和混响,可以参考wekws项目中的add_noise/add_reverb实现。

语音识别-语音增强-加噪声混响相关推荐

  1. 语音增强:基于混响模型的LCMV滤波器

    混响的定义: 混响效果等效为不同延迟的信号的叠加,因此即混响效果可以表示为一个FIR滤波器与信号源卷积的形式. 即 y ( t ) = g ⃗ ∗ s ⃗ ( t ) \mathrm{y}(t)=\v ...

  2. 语音增强原理之噪声估计

    语音增强的整个过程,通常假设噪声为加性随机平稳噪声,且语音短时平稳,下面的原理描述中,都是在这两个假设前提之下来做的.整个语音增强的流程大致可以分为两大部分 一.噪声估计 二.衰减因子(有的地方也叫做 ...

  3. 给语音信号加混响的常用方法(方法一)

    使用python包(pyroomacoustic)给干净语音加混响. Pyroomacoustics是一款旨在快速开发和测试音频阵列处理算法的软件包.包的内容可分为三个主要组成部分: 1.直观的Pyt ...

  4. 语音增强 理论与实践 pdf_语音识别工具ESPnet代码结构

    ESPnet: end-to-end speech processing toolkit 文档网站: https://espnet.github.io/espnet/installation.html ...

  5. 给语音信号加混响的常用方法(方法四)

    使用Adobe audition给语音信号加混响. AU的界面如下图所示: 点击"效果",可看到"混响"的选项,包括了卷积混响,室内混响,环绕声混响等等

  6. 基于维纳滤波的语音增强算法 matlab,基于维纳滤波语音增强算法的改进实现

    通过对维纳滤波的介绍,实现了基本维纳滤波效果;利用两级维纳滤波和两级滤波器组滤波方法实现了语音增强,达到了良好的效果. 维普资讯 http://doc.docsou.com 文章编号:0 2 8 8 ...

  7. 语音增强算法的概述[转]

    选自:http://www.cnblogs.com/chunge2050/p/3159158.html 本课题隶属于学校的创新性课题研究项目.2012年就已经做完了,今天一并拿来发表. 目录: --基 ...

  8. 【信号处理】基于小波变换的语音增强matlab源码

    一.简介 语音通信是人类传播信息,进行交流时使用最多.最自然.最基本的一种手段.而这种通信中的信息载体-语音信号却是一种时变的.非平稳的信号,只有在很短的一段时间内(通常为10~30ms)才被认为是平 ...

  9. 基于小波变换的语音增强算法简单综述

    前言: 语音通信是人类传播信息,进行交流时使用最多.最自然.最基本的一种手段.而这种通信中的信息载体-语音信号却是一种时变的.非平稳的信号,只有在很短的一段时间内(通常为10~30ms)才被认为是平稳 ...

最新文章

  1. 如何利用数据仓库优化数据分析?
  2. HDU1074 Doing Homework
  3. Eigen密集矩阵求解 2 - 求解最小二乘系统
  4. 华为交换机不同网段互访_华为S5700系列交换机使用高级ACL限制不同网段的用户互访...
  5. 【暴力】MSWORLD
  6. win7 下安装oracle 10g
  7. Django 部署基础【使用 Nginx + uWSGI 的方式来部署来 Django】
  8. Vue 项目创建并发布
  9. hdu---1172猜数字
  10. Windows程序设计学习-API-SetBkMode
  11. 3.C#编程指南-字符串
  12. vs2008+sqlserver2008 同一台服务器webconfig 数据连接串的配置要点
  13. 基于RFID定位技术的智能仓储管理系统--RFID智能仓储--新导智能
  14. java 生成csv文件_Java生成CSV文件实例详解
  15. 信息系统开发(JAVA)设计一个银行账户类
  16. python 实现单链表 Lined List
  17. 计算机少了4个磁盘,电脑硬盘突然少了几个分区,这是怎么回事?如何修复?...
  18. st7920驱动OCMJ2X8C屏使用CGRAM自定义图标
  19. 突发!神评论:VMware公司要被英特尔“吞并”了么?
  20. python打印100以内的所有质数

热门文章

  1. 51单片机入门:LED灯实现不同频率闪烁(原理图+程序+仿真)
  2. 统计系列(一)统计基础
  3. 渗透测试工具:主动信息收集Nmap
  4. python 使用Softmax回归处理IrIs数据集
  5. 深度调研前端框架Vue、React、Angular、jQuery,附参考模板!
  6. Linux下安装jboss-5.1.0.GA
  7. 计算机网络研究进展,高性能计算机网络研究进展-人文社科教育.pdf
  8. Python奇妙之旅-出发吧
  9. 局域网即时聊天工具都有哪些?
  10. CSS 3之超链接特效