摘要:

随着数字通信在当今社会的快速发展和广泛应用,低速率语音编码以其极低的编码速率,高质量的合成效果在网络通信,军事通信,保密通信和卫星通信等领域发挥着及其重要的作用,成为语音编码中的关键技术。当前标准化的各种算法中,MELP语音编码算法以LPC声码器为基础作出5大改进,并吸收多带激励等算法的思想,使之在2.4kb/s的编码速率下,能够很好的模拟自然语音的特点从而合成出高质量的合成语音,成为低速率语音编码中的热门技术,并被美国联邦标准采用。 研究语音编解码算法,最终意义在于应用到实际工程中发挥其对音频信号编码解码的作用。在工程应用的过程中,由于语音编码算法往往运算量比较大,时延要求比较严格,同时不同应用平台常常存在各种限制(如存储空间或者运算量大小),根据具体情况选择合适的应用平台,并使算法在平台上有效的运行,和算法在平台上的优化成为实际工程中不可缺少的一个环节。 论文主要针对MELP低速率语音编码技术进行研究,重点解决了MELP语音编码算法在DSP平台上的实现及优化问题,并进一步探讨改进MELP编码算法以降低编码速率。主要研究内容包括: 1)首先从语音编码算法的基础入手,研究语音编码能够实现较低编码速率的理论依据。并从低速率语音编码的算法体制研究当前先进低速率语音编码算法的基本思想。 2)详细研究MELP语音编码算法,分析各种参数的作用,计算方法,量化原理以及在解码端合成语音的具体步骤。并在此基础上对MELP语音编解码算法在Microsoft Visual Studio 2003下用C语言编程实现,利用ITU推荐的P.862算法(PESQ)评估了其语音质量,并分析了合成语音的时域波形图和窄带语谱图。 3)论文在实际工程应用的背景下,选择通用DSP平台作出实现。为了缩短编解码算法执行时间,进行DSP平台上的优化。在优化过程中综合采用编译器优化,inline函数优化,intrinsic函数优化的方法,简单快速地达到了优化的效果。优化后效果比较理想,能够满足工程应用的需要。 4)为了使MELP语音编码算法应用更加广泛,论文对MELP算法的改进进行研究,提出了通过增加每帧处理数据长度,利用归类的方法减少带通声音强度的量化方法,并研究了LSF的量化方法,利用帧间相关性减少量化比特数,作出两种改进算法。并分别对改进算法在Microsoft Visual Studio 2003下作出C语言编程实现,最后合成结果加以分析。合成结果表明两种改进的甚低速率语音编解码算法均能在1.2kb/s左右的编码速率下获得比较高质量的合成语音。

展开

窄带语谱图c语言算法,MELP语音编码算法实现及算法改进相关推荐

  1. 宽带语谱图(wideband spectrogram)和窄带语谱图(narrowband spectrogram)的区别

    1.概念区分 宽带spectrogram: 以3ms(或300Hz左右的带宽)左右进行分帧之后制成的spectrogram 窄带spectrogram: 以20ms(或45Hz左右的带宽)左右进行分帧 ...

  2. python求语音信号短时能量、短时过零率、语谱图

    python语音信号处理(二) 一.短时能量 短时能量主要用于区分浊音段和清音段,因为浊音时E(i)值比清音时大得多:区分声母与韵母的分界和无话段与有话段分界. 计算第i帧语音信号yi(n)的短时能量 ...

  3. 语音信号处理(四):生成语音信号的语谱图

    关于语谱图的简单介绍可以参考这篇文章 现代语音信号处理之语谱图(spectrogram) 下面对 ai d s t 这四个语音进行语谱图绘制 绘制代码如下 mkdir('***');%新建存放语谱图的 ...

  4. 【语音信号处理】1语音信号可视化——时域、频域、语谱图、MFCC详细思路与计算、差分

    基本语音信号处理操作入门 1. 数据获取 2. 语音信号可视化 2.1 时域特征 2.2 频域特征 2.3 语谱图 3. 倒谱分析 4. 梅尔系数 4.1 梅尔频率倒谱系数 4.2 Mel滤波器原理 ...

  5. python绘制语谱图(手动实现)

    1 原理分析 在获取语谱图数据之前,我们需要先了解短时傅里叶变换.语音信号是典型的非平稳信号,但是由于其非平稳性由发声器官的物理运动过程而产生,这种过程是相对变换缓慢的,在10~30ms以内可以认为是 ...

  6. 使用tensorflow和densenet神经网路实现语谱图声纹识别,即说话人识别。

    介绍 本文介绍一种使用tensorflow框架和densenet神经网路实现声纹语谱图识别算法,即说话人识别.本文侧重一种解决方案的思路,仅做了小批量数据的简单验证,收敛效果良好,还没有做大量数据集的 ...

  7. 语谱图(二) Spectrogram 的产生

    1. 信号预处理部分 预处理部分中 包括 预加重 分帧 加窗 : 1.1 读取音频数据 python可以用librosa库来读取音频文件,但是对于MP3文件,它会自动调用audio_read函数,所以 ...

  8. 语谱图的实现与种类,与画图

    1. 语谱图的矩阵 1.1 原始矩阵 首先原始矩阵,从上到下,依次为第0 行, 到最后一行: 1.2 语谱图矩阵 最终生成的语谱图矩阵数据, 从上到下,第0 行代表低频,最后一行代表高频: 1.3 矩 ...

  9. python画图标题为蓝色_python绘制语谱图怎么设置成黄蓝色

    展开全部 语音的时域分析和频32313133353236313431303231363533e59b9ee7ad9431333431333937域分析是语音分析的两种重要方法,但是都存在着局限性.时域 ...

最新文章

  1. Mac系统的JDK8默认安装路径
  2. 50多种适合机器学习和预测应用的API,你的选择是?(2018年版本)
  3. 【ArcGIS 10.2新特性】Geodatabase 10.2 常见问题
  4. 《C++ 开发从入门到精通》——1.3 使用Visual Studio 2010
  5. KDD走进阿里 数百专家聚集探讨产学研一体化
  6. DTC精彩回顾—韩锋:AnalyticDB,金融级云原生数据仓库及最佳实践丨PPT视频
  7. php 旋转图片 保存,如何在PHP中旋转并保存图像
  8. 人本原理内涵_叶澜教育学原理课后答案资料配套题库考研真题精选课后习题章节题库...
  9. 只会用console.log调试?快来试试这些高效的调试方法
  10. ​炸裂!万字长文拿下 HTTP 我在字节跳动等你!
  11. 安装anaconda,jupyter基本操作说明快捷键使用
  12. UG NX 12 取消选择对象
  13. 移远BC95 nbiot接入华为OC云平台(电信云)
  14. 极通EWEBS 常见问题及其解决办法
  15. github windows系统监控_windows快速制作U盘启动工具Rufus
  16. 『光纤交换机级联设置 』光纤跳线及光纤交换机端口级联类型
  17. 固态硬盘是什么接口_今天说事儿—固态硬盘接口,防你入坑
  18. 大数据时代的小数字感:数据再有价值,别人听不懂照样没用
  19. linux 渗透 系统,初识Linux渗透:从枚举到内核利用
  20. [Usaco2010 Hol]cowpol 奶牛政坛

热门文章

  1. 闲鱼推荐,让智能计算从云走向端
  2. 苹果将于 2025 年推出的 Apple Car 长什么样?
  3. 自动替换 Kubernetes 镜像
  4. AIoT时代的新思维
  5. 没错!Python程序员正在消失,HR:你才知道?
  6. 详析 Kubernetes 在边缘计算领域的发展
  7. 5G精华问答 | 5G关键技术解读
  8. 嘿,运维!你与VXLAN有场约会……
  9. linux下qt生成可安装的程序,linux – 如何为Qt应用程序创建“安装”包?
  10. python document_python处理document文档保留原样式