论文的全称是《CASCADED TIME + TIME-FREQUENCY UNET FOR SPEECH ENHANCEMENT: JOINTLY ADDRESSING CLIPPING, CODEC DISTORTIONS, AND GAPS

研究动机

语音增强是用于处理噪声的,这篇文章是为了处理三种不常见的噪声而提出的。

INTRODUCTION

本文处理的三种噪声分别是speech clipping, codec distortions, gaps。首先,第一种噪声一种非线性噪声,它是当语音信号超过了麦克风录制的动态范围就会出现,而这个动态范围指的是麦克风输出最小信号和最大信号之间的差值,如果足够大的动态范围就能够最大程度的保留原始音质不发生失真。第二种噪声的出现是编码失真,当语音在传输的过程中出现的一种有损的传输。 第三种噪声出现是因为网络的环境太差,这里的网络指的是IP网络。第三种噪声需要填充的方法进行填充。

本文主要的方式是联合起来处理三种噪声。

网络结构如下,采用了一个时域的UNET,一个频域的UNET实现联合处理。其中采用的卷积卷积核用的是5,步长是2。

下面这张图展示了如何进行的联合处理,首先,第一个网络处理掉的是speech clipping和gap噪声,第一个网络输出的是带codec类型噪声的带噪音频送入到第二个网络里面处理,输出目标是纯净语音。

数据准备

DNS数据集用于了训练和测试,所有的数据都是16khz。

实验

分别单独去除掉三种噪声和联合去除掉三种噪声:

总结

去除掉噪声效果挺好的,指标很高。

《CASCADED TIME + TIME-FREQUENCY UNET FOR SPEECH ENHANCEMENT:JOINTLY ADDRESSING CLIPPING》论文阅读相关推荐

  1. 《基于卷积神经网络的深度迁移学习,用于燃气轮机燃烧室的故障检测》论文阅读

    目录 突出 抽象 引言 1.1动机 1.2文献综述获得的结论 1.3贡献 1.4组织 2方法 2.1燃汽轮机组故障知识共享 2.2迁移学习 2.3 基于卷积神经网络的深度迁移学习 2.4用于燃气轮机燃 ...

  2. 基于卷积神经网络和投票机制的三维模型分类与检索 2019 论文笔记

    作者:白静 计算机辅助设计与图形学学报 1.解决的问题 由于三维模型投影得到的视图是由不同视点得到,具有相对独立性,这种像素级的融合运算并没有直接的物理或者几何意义,更有可能造成图像有益信息淹没和混淆 ...

  3. TextCNN——基于卷积神经网络的文本分类学习

    1.CNN基础内容 CNN的全称是Convolutional Neural Network,是一种前馈神经网络.由一个或多个卷积层.池化层以及顶部的全连接层组成,在图像处理领域表现出色. 本文主要学习 ...

  4. 读懂深度迁移学习,看这文就够了 | 赠书

    百度前首席科学家.斯坦福大学副教授吴恩达(Andrew Ng)曾经说过:迁移学习将是继监督学习之后的下一个促使机器学习成功商业化的驱动力. 本文选自<深度学习500问:AI工程师面试宝典> ...

  5. 一种基于卷积神经网络的图像去雾研究-含matlab代码

    目录 一.绪论 二.去雾卷积网络 2.1 特征提取 2.2 多尺度映射 2.3 局部均值 2.4 非线性回归 三.实验与分析 四.Matlab代码获取 一.绪论 雾是一种常见的大气现象,空气中悬浮的水 ...

  6. 机械臂论文笔记(一)【基于卷积神经网络的二指机械手 抓取姿态生成研究 】

    基于卷积神经网络的二指机械手 抓取姿态生成研究 论文下载 摘要 第1章 绪论 1.1 抓取生成国内外研究现状 1.1.1已知物体抓取生成 1.1.2相似物体抓取生成 1.1.3 未知物体抓取生成 1. ...

  7. 毕业设计 - 基于卷积神经网络的乳腺癌分类 深度学习 医学图像

    文章目录 1 前言 2 前言 3 数据集 3.1 良性样本 3.2 病变样本 4 开发环境 5 代码实现 5.1 实现流程 5.2 部分代码实现 5.2.1 导入库 5.2.2 图像加载 5.2.3 ...

  8. 基于卷积神经网络与迁移学习的油茶病害图像识别

    基于卷积神经网络与迁移学习的油茶病害图像识别 1.研究思路 利用深度卷积神经网络强大的特征学习和特征表达能力来自动学习油茶病害特征,并借助迁移学习方法将AlexNet模型在ImageNet图像数据集上 ...

  9. Python深度学习实例--基于卷积神经网络的小型数据处理(猫狗分类)

    Python深度学习实例--基于卷积神经网络的小型数据处理(猫狗分类) 1.卷积神经网络 1.1卷积神经网络简介 1.2卷积运算 1.3 深度学习与小数据问题的相关性 2.下载数据 2.1下载原始数据 ...

  10. 基于卷积神经网络实现图片风格的迁移 1

    卷积神经网络详解 一.实验介绍 1.1 实验内容 Prisma 是最近很火的一款APP,它能够将一张普通的图像转换成各种艺术风格的图像.本课程基于卷积神经网络,使用Caffe框架,探讨图片风格迁移背后 ...

最新文章

  1. php地址后面拼接页码,php分页类尾部页码导航代码
  2. 杭州新设大数据资源管理局 推动资源共享、市场规范
  3. 在Fragment中实现百度地图,定位到当前位置(基于SDKv2.1.0)
  4. 永辉选任新董事长及管理层 创始人张轩松:我和张轩宁没矛盾
  5. 【网址收藏】Spark History Server配置及使用
  6. 深入浅出 RPC - 浅出篇+深入篇
  7. Codeforces Round #721 (Div. 2)
  8. 如何处理JavaScript中的事件处理(示例和全部)
  9. apache 统计404日志_Apache监控与调优(四)Apachetop监控
  10. Java 面试题全梳理
  11. LoadRunner入门教程(4)—web性能测试常用指标
  12. 性能测试---性能指标【1】
  13. 64位 Windows PLSQL Developer客户端配置方法
  14. java applet的方法_Java Applet的常用方法
  15. STM32F103 CubeMX:ETR外部脉冲计数器
  16. 聚合广告SDK文档(Kotlin)
  17. xy苹果助手未受信任_苹果应用掉证书?突然打不开怎么办?
  18. Java学习笔记Day02
  19. C++实现的Buffer类
  20. 电脑开机后电脑连接正常几分钟后网络连接失败

热门文章

  1. [新闻观察]中国网络“名人博客”风声水起
  2. arcmap小技巧之获取行政区划及json格式转shp,json转csv
  3. 游戏是程序员的深坑?
  4. Mysql为何不推荐写多表SQL
  5. 阿里开发者工具盘点:用它!让开发事半功倍
  6. 送书 |《Python数据分析从小白到专家》
  7. PMP-PMBOK-培训(7)Initiating a Project and Preparing the Project Plan
  8. 4年功能测试月薪9.5K,3个月时间成功进阶自动化,跳槽涨薪6k后我的路还很长...
  9. americdan-life
  10. 安卓开发SDK等工具下载地址