基于MATLAB的语音信号处理GUI设计

一、课题研究的意义

本课题旨在对音频文件的调制和滤波。音频信号处理是研究用数字信号处理技术和语音学知识对语音信号进行处理的新兴的学科,是目前发展最为迅速的信息科学研究领域的核心技术之一。通过声音传递信息是人类最重要、最有效、最常用和最方便的交换信息形式。同时,声音也是人与机器之间进行通信的重要工具,它是一种理想的人机通信方式,因而可为信息处理系统建立良好的人机交互环境,进一步推动计算机和其他智能机器的应用,提高社会的信息化程度。

语音信号是基于时间轴上的一维数字信号,在这里主要是对语音信号进行频域上的分析。在信号分析中,频域往往包含了更多的信息。对于频域来说,大概有8种波形可以让我们分析:矩形方波,锯齿波,梯形波,临界阻尼指数脉冲波形,三角波,余旋波,余旋平方波,高斯波。对于各种波形,我们都可以用一种方法来分析,就是傅立叶变换:将时域的波形转化到频域来分析。

语音信号处理是一门新兴的学科,同时又是综合性的多学科领域和涉及面很广的交叉学科。虽然从事这一领域研究的人员主要来自信号与信息处理及计算机应用等学科,但是它与语音学、语言学、声学、认知科学、生理学、心理学等许多学科也有非常密切的联系。

二、课题发展历程和现状

在60年代,计算机的广泛应用推动了语音识别技术的发展,出现了多种语音信号分析方法,提出了动态规划(DP)和线性预测分析(LP)技术。其中后者较好地解决了语音信号产生模型的问题,对语音识别的发展产生了深远影响。 70年代,语音识别理论取得了突破。LP技术得到进一步发展,动态时间归正技术(DTW)基本成熟,特别是提出了矢量量化(VQ)和隐马尔可夫模型(HMM)理论。在实践上,实现了基于线性预测倒谱和DTW技术的特定人孤立语音识别系统。 80年代,HMM模型和人工神经元网络(ANN)成功应用于实践,并于1988年由CMU研制出了非特定人、大词汇量、连续语音识别系统—SPHINX。它可以理解由1000个单词构成的4200个句子,被认为是语音识别历史上的一个里程碑。HMM模型的广泛应用应归功于AT&T Bell实验室Rabiner等科学家的努力,他们把原本晦涩难懂的HMM纯数学模型工程化,从而为更多研究者了解和认识。ANN和HMM模型建立的语音识别系统,性能相当。 进入90年代,随着多媒体时代的来临,迫切要求语音识别系统从实验室走向实用。许多著名的大公司如IBM、苹果、AT&T和NTT都对语音识别系统的实用化研究投以巨资。

语音识别技术有一个很好的评估机制,那就是识别的准确率,而这项指标在20世纪90年代中后期实验室研究中得到了不断的提高。比较有代表性的系统有:IBM公司推出的Via Voice和Dragon System公司的Naturally Speaking Nuance公司的Nuance Voice Platform语音平台,Microsoft的Whisper Sun的Voice Tone等。语音识别也得到了更多的商用,其中SpeechWorks6是世界领先的电话自动语音识别系统解决方案提供者—SpeechWorks公司的代表产品。利用该产品,用户可以通过电话用自然语言与系统进行交互,进行旅游预约、股票交易、银行服务、订票服务、宾馆服务和寻呼服务等,无需服务人员的介入。目前市场上出现了语音识别电话、语音识别记事本等产品,如美国VPTC公司的VoiceOrganizer和法国的Parrot等。

在我国,语音技术的研究起步较晚,70年代末才开始了语音技术的研究,但在很长一段时间内,都处于缓慢发展的阶段,直到80年代后期,随着计算机应用技术在我国的逐渐普及和数字信号处理技术的进一步发展,国内许多单位纷纷投入到这项研究工作中去,其中有中科院声学所,自动化所,清华大学,四川大学和西北工业大学等科研机构和高等院校,大多数研究者致力于语音识别的基础理论研究工作、模型及算法的研究和改进。但由于起步晚、基础薄弱、计算机水平不发达,导致在整个80年代,我国在语音识别研究方面并没有形成自己的特色,更没有取得显著的成果和开发出大型性能优良的实验系统。

三、实现功能

在本课题中,所要研究的内容首先是语音的录入部分和对录入的音频数据进行频谱的分析并画出其图像。其次是设计滤波器并对加入噪声后的音频文件进行滤波并考察其使用情况以此来检验滤波器的设计是否正确。

本课题研究内容包括:

  1. 对音频信号进行采集:使用MATLAB中的wavread命令对音频文件进行采集。并使用sound命令对原信号进行播放用于对添加噪声后的信号进行对比。
  2. 图形用户界面GUI的设计:包含设置界面及按钮并对各按钮功能能进行编程。需要实现按键执行信号播放,加噪声和滤波的功能。
  3. 利用傅里叶变换求信号的频域并作图:使用MATLAB中的傅里叶变换命令对已经采集到的音频信号做傅里叶变换,变换完成后画出其在频域上的波形并对原时域上的波形进行对比。
  4. 对采样后的信号进行加噪声处理:使用matlab中的相关命令。WGN, AWGN。WGN用于产生高斯白噪声,AWGN则用于在某一信号中加入高斯白噪声。也可直接用randn函数产生高斯分布序列。
  5. 设计数字滤波器:设计一个数字滤波器时,根据指标先写出模拟滤波器的公式,再通过一定的变换,将模拟滤波器的公式转换成数字滤波器的公式。

四、 算法流程图

开始工作

对音频信号采集

音频信号的处理

验证滤波效果

添加噪声

对原信号进行傅里叶变换

使用滤波器对信号滤波

画图观察采集信号的时域波形

画图观察变换后信号的频域波形

使用不同种类的滤波器,观察区别

五、 音频信号处理

5.1 音频的采集与作图

本次实验采用wavread命令对声音信号进行采集,在采集的过程中采样频率是由MATLAB软件自行定义的,由于录制声音采样率较低故可以不设定采样频率仅使用软件默认的采样频率进行采样。

以下展示的程序为语音信号在MATLAB中操作的表现,它实现了语音的读入打开,并利用FFT快速傅里叶变换绘出了语音信号的波形图频谱图。

clear all;
music=input('输入文件名:','s')
[y,fs,nbits]=wavread(music);         %音频信号的采集
sound(y,fs,nbits);                   %音频信号的播放
n=length(y);                         %设定长度
Y=fft(y,n);                          %快速傅里叶变换
figure;                              %控窗
subplot(2,1,1);
plot(y,’r’);
title('波形图','fontweight','blod');
grid;                                %网格
subplot(2,1,2);
plot(abs(Y),’b’);                  %取绝对值
title('频谱图','fontweight','blod');
grid;

如图所示,展示的是一段语音信号的时域和频域波形

5.2对采集信号进行加噪声处理。

MATLAB中产生高斯白噪声的两个函数

MATLAB中产生高斯白噪声非常方便,可以直接应用两个函数,一个是WGN,另一个是AWGN。WGN用于产生高斯白噪声,AWGN则用于在某一信号中加入高斯白噪声。

在设计中使用的是直接产生高斯噪声的RANDN函数,实验采用的是MATLAB中的随机函数rand产生噪声加入到语音信号中,通过对噪声信号的加入以此来实现模仿语音信号被污染,并对添加噪声后的文件进行频谱分析。

matlab函数randn:产生正态分布的随机数或矩阵的函数

randn

产生均值为0,方差 σ^2 = 1,标准差σ = 1的正态分布的随机数或矩阵的函数。

用法:

Y = randn(n)

返回一个n*n的随机项的矩阵。如果n不是个数量,将返回错误信息。

Y = randn(m,n) 或 Y = randn([m n])

返回一个m*n的随机项矩阵。

Y = randn(m,n,p,...) 或 Y = randn([m n p...])

产生随机数组。

Y = randn(size(A))

返回一个和A有同样维数大小的随机数组。

在本次实验过程中,我们选用Randn(m,n)函数。对语音信号添加噪声及其频谱分析的主要程序如下:

clear all;
music=input('输入文件名:','s')
[y,fs,nbits]=wavread(music);%语音信号的采集
n = length (y)
Noise=0.3*randn(n,2);   %编辑噪声
s=y+Noise;
Y=fft(y,n);
sound(s);
S=fft(s);
figure;
subplot(2,2,1);
plot(y,'r');
title('时域波形图','fontweight','bold');
grid;
subplot(2,2,2);
plot(abs(Y),'r');
title('频域波形图','fontweight','blod');
subplot(2,2,3);
plot(s);
title('加噪时域波形图','fontweight','bold');
grid;
subplot(2,2,4);
plot(abs(S));
title('加噪频域波形图','fontweight','bold');
grid;
;

程序运行结果如下:

加噪后信号波形图

5.3 扩展内容:量标准化

录制声音过程中需对声音电平进行量化处理,最理想的量化是最大电平对应最高量化比特,但实际却很难做到,常有轻音问题。利用MATLAB很容易实现音量标准化,即最大电平对应最高量化比特。基本步骤是:先用wavread函数将.wav文件转换成列数组变量;再求出数组变量的极值并对所有元素作归一化处理;最后用wavwrite函数还原成音量标准化的.wav文件。

运行程序如下:

clear all;
music=input('输入文件名:','s')
[y,fs,nbits]=wavread(music);%语音信号的采集
ym=max(max(max(y)),max(abs(min(y))));
x=y/ym;
figure;
subplot(2,1,1);
plot(y,’r’);
title('原图','fontweight','blod');
grid;                                %网格
subplot(2,1,2);
plot(x,’b’);
title('改图','fontweight','blod');
grid;
sound(x)
wavwrite(x,fs,bits,'2.wav');

程序内容为:对原语音信号处理保存后播放并画出时域波形图,有音量增大的效果。但于实际测试播放时声音会有一定程度的失真。

程序运行结果:

如图,运行后相较于原波形图有了一定程度的幅度提高。

5.4扩展内容2:信号的重采样

在语音信号的分析与处理过程中往往会对原语音信号进行重采样处理。经过重采样后能够减少程序的运行负担。在低配置的电脑系统中较为重要。

同时,重采样还能够带来降频和倍频的功能。在平时的信号处理中这种变换调整也经常要用到。所以在设计中也添加了这种功能,通过相关的处理可以使语音信号的声音特征产生一定的变化。在本次实验中,常通过重采样功能对声音信号进行调制。故在此进行部分说明。在本次软件使用时重采样功能多用于对原声音文件进行降频。

以下为本次实验中使用的重采样功能的部分代码:

fre=get(handles.popagainhz,'string');
popup_sel_index = get(handles.popagainhz, 'Value');
switch popup_sel_indexcase 1fre=1000;case 2fre=2000;case 3fre=4000;
end
figure(4);
subplot(2,2,1);
plot(ft);
title('原始信号波形');xlabel('时间');ylabel('幅度');
subplot(2,2,2);
Y=fft(ft);
plot(abs(Y));
title('原始信号频谱');xlabel('频率');ylabel('幅度');
%重采样
y2=resample(ft,1,Fs/fre);
sound(y2,fre);
subplot(2,2,3);
plot(y2);
title('重采样后信号波形');xlabel('时间');ylabel('幅度');
subplot(2,2,4);
Y2=fft(y2);
plot(abs(Y2));
title('重采样后信号频谱)');xlabel('时间');ylabel('幅度');

六、参考文献

[1] 郑春佳、陈仅星、陈金西,【数字信号处理-基于数值计算】西安电子科技大学出版社.

[3] 刘卫国,【matlab程序设计与应用】高等教育出版社.

[3] 胡航,【语音信号处理】哈尔滨工业大学出版社.

[4] 刘幺和、宋庭新,【语音识别与控制技术】,科学出版社.

[5] 苏金明、张莲花、刘波,【MATLAB工具箱应用】,电子工业出版社.

[6] 赵新敏,(语音信号的识别技术),学位论文,天津大学.

[7] 网友,(基于MATLAB的有噪声引号处理),学位论文,南京大学

[8] 王京辉,(语音信号处理技术研究) 论文,山东大学.

[9] 赵力,语音信号处理,机械工业出版社.

[10] 陈杰,【Matlab宝典】电子工业出版社.

[11] (美) Sanjit K. Mitra著;孙洪, 余翔宇等译.【数字信号处理实验指导书】

[12] 杨述斌,李永全,【数字信号处理实践教程】华中科技大学出版社

[14] Gersho A,Gr R M.Vector quantization and signalCompression,Boston,Kluwer Academic Publishers.

基于matlab的音频信号处理毕业设计(含源文件相关推荐

  1. 基于matlab的音频信号处理系统,毕业设计-基于matlab的语音信号处理及分析

    资料简介 毕业设计 基于matlab的语音信号处理及分析(共19页,8147字) 引言 数字信号处理的主要研究对象是数字信号,且是采用运算的方法达到处理的目的的,因此,其实现方法,基本上分成两种实现方 ...

  2. 基于MATLAB的图像压缩感知设计(含源文件)

    欢迎添加微信互相交流学习哦! 项目源码:https://gitee.com/oklongmm/biye 名称    基于MATLAB的图像压缩感知 目录 目录    I 第1章 绪论    3 1.1 ...

  3. 基于php的购物网站源代码,基于PHP的购物网站毕业设计(含源文件).doc

    毕业论文 题 目: 基于PHP的网上购物网站 院系名称: 专业班级: 学生姓名: 学 号: 指导教师: 教师职称: 摘要 随着Internet技术的发展,人们的日常生活已经离不开网络.未来社会人们的生 ...

  4. 基于matlab的语音信号基本处理系统,基于matlab的语音信号处理及分析

    内容简介: 毕业设计 基于matlab的语音信号处理及分析(共19页,8147字) 引言 数字信号处理的主要研究对象是数字信号,且是采用运算的方法达到处理的目的的,因此,其实现方法,基本上分成两种实现 ...

  5. 【雷达通信】基于matlab雷达探测威力仿真【含Matlab源码 1974期】

    一.获取代码方式 获取代码方式1: 完整代码已上传我的资源:[雷达通信]基于matlab雷达探测威力仿真[含Matlab源码 1974期] 点击上面蓝色字体,直接付费下载,即可. 获取代码方式2: 付 ...

  6. 【OFDM通信】基于matlab OFDM通信系统仿真【含Matlab源码 2521期】

    ⛄一.获取代码方式 (附课程作业报告) 获取代码方式1: 完整代码已上传我的资源:[OFDM通信]基于matlab OFDM通信系统仿真[含Matlab源码 2521期] 点击上面蓝色字体,直接付费下 ...

  7. 【雷达通信】基于matlab雷达仿真模拟系统【含Matlab源码 150期】

    ⛄一.获取代码方式(附课程作业报告) 获取代码方式1: 完整代码已上传我的资源:[雷达通信]基于matlab雷达仿真模拟系统[含Matlab源码 150期] 点击上面蓝色字体,直接付费下载,即可. 获 ...

  8. 【心电信号】基于matlab心电图PQRST检测【含Matlab源码 1549期】

    ⛄一.获取代码方式 获取代码方式1: 完整代码已上传我的资源:[心电信号]基于matlab心电图PQRST检测[含Matlab源码 1549期] 点击上面蓝色字体,直接付费下载,即可. 获取代码方式2 ...

  9. 【音乐检索】基于matlab音乐检索系统【含Matlab源码 435期】

    一.获取代码方式 获取代码方式1: 完整代码已上传我的资源:[音乐检索]基于matlab音乐检索系统[含Matlab源码 435期] 点击上面蓝色字体,直接付费下载,即可. 获取代码方式2: 付费专栏 ...

最新文章

  1. Lucene.Net无障碍学习和使用:索引篇
  2. JavaScript那些事儿-不被知晓的预解释
  3. 73. Leetcode 230. 二叉搜索树中第K小的元素 (二叉搜索树-中序遍历类)
  4. 异步与并行~ReaderWriterLockSlim实现的共享锁和互斥锁
  5. 【学习笔记】 IPv4地址、NAT与子网掩码、子网划分
  6. 正则匹配后缀 html,如何用正则匹配后缀名不为.jpg, .css, .js, .html, .htm, .png的文件...
  7. Python内置库修炼——turtle绘图库指令大全
  8. Luogu3941[湖南集训2017] 入阵曲
  9. Java实现xlsx文件下载和文件上传
  10. 今天您大数据营销了吗?
  11. Android 使用listview实现树形结构
  12. 为什么五笔输入法打字那么快,现在使用的人却越来越少了?
  13. 【土旦】vue项目中 使用 pako.js 解密 gzip加密字符串
  14. python3入门与进阶笔记_Python3入门与进阶【笔记】
  15. 【PTA~21年GPLT团体程序天梯赛-L1题】
  16. 130 个令你眼前一亮的网站,总有用得着的
  17. XmlHttp的open( )方法
  18. (CVPR-2021)RepVGG:极简架构,SOTA性能,让VGG式模型再次伟大
  19. 程序员常见英文缩写及其意义
  20. 德艺双修才貌双全 史上16位青楼佳人 迷住宋徽宗的李师师

热门文章

  1. 多个vue项目合并成一个_多个Excel表格合并成一个表,最简单的方法在这里
  2. SkeyeARS全景AR增强监视系统智慧城市应用、城市道路监管解决方案
  3. SUN 的JDO标准
  4. 软件可靠性分析方法有失效模式影响分析法、严酷度分析法、故障树分析法、事件树分析法、潜在线路分析法
  5. 终于可以向重复的鉴权代码说byebye 了 -- (玩转 AOP和Annotation )
  6. 应用系统数据对接几种方案
  7. mysql查找删除重复数据并只保留一条
  8. 简单的数据结构介绍(栈、队列、数组、链表、红黑树)
  9. 《Android Studio开发实战 从零基础到App上线》第一版的资源下载和内容勘误
  10. 泰捷we30c系统语言,泰捷方盒WE30C测评:看电视久违的清爽