一、案例简介

1 实验要求
1.录一段声音,内容为“间隔读出数字0-4”,转为单声道、8khz、wav格式;
2.每帧帧长20ms160个样点,使用汉明窗hamming加窗;
3.设定能量阈值,判断语音中无声、有声区间;
4.计算短时自相关 R(k),k取20-100,计算基音周期和基音频率;
5.信息预测:数字“0”的预测增益E0/Ep(原始信号能量/残差信号能量),并求预测系数a1-a10,阶数p取10。

2 思 路
先对声音进行窗函数划分帧,160个样点一帧,计算各帧短时能量,设定能量阈值筛选出5段浊音段,每段分别进行以下操作:段中的每一帧计算自相关函数(k为自相关滞后时间,取20-100),通过波峰最大值点计算得到该帧浊音的基音频率,进而计算该段的基音频率,进而计算5段浊音段的基音频率。
对于信息预测,对于数字“0”的语音段的某一帧(如第101帧),利用lpc 函数得到阶数取10下的预测系数,进而计算预测信号及残差信号,利用预测增益公式E0/Ep(原始信号能量/残差信号能量)计算得到预测增益。

二、部分源代码

clc;
clear all;
close all;        % 读取语料
[y,fs,wmode,fidx]=readwav('number.wav','p',-1,-1);
figure(1);stem(y,'.');title('原始音频波形');%显示声音的波形
%l=length(y);%分帧
%f=enframe(y,hamming(160));                   %分帧长:20ms(160样点)
%figure(2);stem(f,'.');title('分帧后的音频波形');%显示声音的波形%加窗,计算短时能量
for k = 1:nFramesE(k) = sum(y_sub.^2);
end
figure(2);stem(E,'.');title('全区间的短时能量图');%如何设定能量阈值为0.001得到安静、有声的区间?
for i = 1:nFramesif E(i)<0.001E(i)=0end
end
figure(3);stem(E,'.');title('有声区间的短时能量图');%处理后的帧的短时能量图像%计算短时自相关
n=160;
for m=1:length(y)/n            %对每一帧求短时自相关函数,每帧的Rm最大值存在N(m)里Rm(k)=0;Rm(k)=Rm(k)+y(i+(m-1)*n)*y(i+k+(m-1)*n);endendend                            %计算基音周期和基音频率
%N=N+10;                        %补回前边去掉的10个点
%T=N/8;                         %算出对应的周期figure(4);stem(T,'.');axis([0 length(T) 0 20]);
xlabel('帧数(n)');ylabel('周期(ms)');title('初始未处理的基音周期');T1= medfilt1(T,7);             %去除野点,中值平滑
for k = 1:nFramesif E(k)==0T1(k)=0;end
end
figure(5);stem(T1,'.');axis([0 length(T1) 0 20]);
xlabel('帧数(n)');ylabel('周期(ms)');title('中值滤波后的基音周期');for k = 1:nFramesif E(k)==0F1(k)=0;end
end
figure(6);stem(F1,'.');
xlabel('帧数(n)');ylabel('频率(Hz)');title('基音频率');%计算数字“0”的差分方程系数和预测增益y1=y(99*160:100*160-1);  %取数字“0”的一帧(第100帧),进行汉明加窗
A=lpc(y1.*w,p);  %得到系数(11个系数中第一个系数值为1)
est_Frame=filter([0 -A(2:end)],1,y1);%estimate frame(lp)预测第100/101帧?
FFT_est=fft(est_Frame);
%y2=y(100*160:101*160-1);figure(7);
%subplot(221);plot(1:3360,y1,1:3360,est_Frame,'-r');grid;title('原始语音帧 vs.预测后的语音帧');
subplot(221);plot(y1);grid;title('原始语音段');
%subplot(222);plot(est_Frame);grid;title('预测语音段');
subplot(222);plot(est_Frame);grid;title({'预测语音段及10个预测系数',[num2str(A(2)),',',num2str(A(3)),',',num2str(A(4)),',',num2str(A(5)),',',num2str(A(6)),',',num2str(A(7)),',',num2str(A(8)),',',num2str(A(9)),',',num2str(A(10)),',',num2str(A(11))]});
subplot(223);plot(err);grid;title('误差');
subplot(224);plot(prodictive_gain);grid;title('预测增益');

三、运行结果






四、matlab版本及参考文献

1 matlab版本
2014a

2 参考文献
[1]韩纪庆,张磊,郑铁然.语音信号处理(第3版)[M].清华大学出版社,2019.
[2]柳若边.深度学习:语音识别技术实践[M].清华大学出版社,2019.

【语音分析】基于matlab短时自相关基音周期检测+LPC预测增益计算【含Matlab源码 1517期】相关推荐

  1. 【语音分析】短时自相关基音周期检测+LPC预测增益计算【含Matlab源码 1517期】

    ⛄一.案例简介 1 实验要求 1.录一段声音,内容为"间隔读出数字0-4",转为单声道.8khz.wav格式: 2.每帧帧长20ms160个样点,使用汉明窗hamming加窗: 3 ...

  2. 【Matlab树叶分类】BP神经网络植物叶片分类【含GUI源码 916期】

    一.代码运行视频(哔哩哔哩) [Matlab树叶分类]BP神经网络植物叶片分类[含GUI源码 916期] 二.matlab版本及参考文献 1 matlab版本 2014a 2 参考文献 [1] 蔡利梅 ...

  3. 【Matlab水果蔬菜识别】形态学水果蔬菜识别【含GUI源码 919期】

    一.代码运行视频(哔哩哔哩) [Matlab水果蔬菜识别]形态学水果蔬菜识别[含GUI源码 919期] 二.matlab版本及参考文献 1 matlab版本 2014a 2 参考文献 [1] 蔡利梅. ...

  4. 【Matlab指纹识别】指纹识别门禁系统【含GUI源码 1692期】

    一.代码运行视频(哔哩哔哩) [Matlab指纹识别]指纹识别门禁系统[含GUI源码 1692期] 二.matlab版本及参考文献 1 matlab版本 2014a 2 参考文献 [1] 包子阳,余继 ...

  5. 【Matlab青草识别】形态学马唐草+牛筋草识别【含GUI源码 908期】

    一.代码运行视频(哔哩哔哩) [Matlab青草识别]形态学马唐草+牛筋草识别[含GUI源码 908期] 二.matlab版本及参考文献 1 matlab版本 2014a 2 参考文献 [1] 蔡利梅 ...

  6. 【Matlab限速标志识别】形态学限速标志识别【含GUI源码 1142期】

    一.代码运行视频(哔哩哔哩) [Matlab限速标志识别]形态学限速标志识别[含GUI源码 1142期] 二.matlab版本及参考文献 1 matlab版本 2014a 2 参考文献 [1] 蔡利梅 ...

  7. 【Matlab语音分析】语音信号分析【含GUI源码 1718期】

    一.代码运行视频(哔哩哔哩) [Matlab语音分析]语音信号分析[含GUI源码 1718期] 二.matlab版本及参考文献 1 matlab版本 2014a 2 参考文献 [1]韩纪庆,张磊,郑铁 ...

  8. 【Matlab语音加密】语音信号加密解密(带面板)【含GUI源码 181期】

    一.代码运行视频(哔哩哔哩) [Matlab语音加密]语音信号加密解密(带面板)[含GUI源码 181期] 二.matlab版本及参考文献 1 matlab版本 2014a 2 参考文献 [1]韩纪庆 ...

  9. 【Matlab语音隐写】DCT+DWT音频数字水印嵌入提取【含GUI源码 836期】

    一.代码运行视频(哔哩哔哩) [Matlab语音隐写]DCT+DWT音频数字水印嵌入提取[含GUI源码 836期] 二.matlab版本及参考文献 1 matlab版本 2014a 2 参考文献 [1 ...

  10. 【Matlab语音隐写】DWT音频数字水印【含GUI源码 712期】

    一.代码运行视频(哔哩哔哩) [Matlab语音隐写]DWT音频数字水印[含GUI源码 712期] 二.matlab版本及参考文献 1 matlab版本 2014a 2 参考文献 [1]韩纪庆,张磊, ...

最新文章

  1. 悟道 · 文溯详解:蛋白质序列的大规模预训练
  2. file watchers怎么默认打开_Python读写文件怎么和我之前学的不一样?
  3. miniui datagrid 隐藏列默认赋值_Qt商业组件DataGrid:内置视图和布局详解(一)
  4. Linux工作笔记-ssh中-X属性的使用(Linux传界面)
  5. sicily 1002. Anti-prime Sequences
  6. WinEdt编译重新生成PDF以及找到模板tex对应的论文树形结构
  7. materialize框架select使用JavaScript添加option注意事项
  8. MapReduce 基础案例 之 平均值 计算
  9. Hadoop解除安全模式
  10. 【进大厂必学】面完 10 多家大厂后,总结了这些太容易被考的算法
  11. 题目 1536: 最长单词
  12. 面试官问“为什么应聘这个岗位”,应该如何回答?
  13. 计算机经典书籍电子书合集
  14. 2019杭电计算机考研经验贴(初试+复试)
  15. 小程序使用场景展示-小程序开发
  16. C++——不使用sqrt实现开根号
  17. python的写操作_Python—文件读写操作
  18. obs媒体源没有声音_绝地求生的推荐直播参数和获取方法 在阅读本教程之前,请提前下载好斗鱼伴侣或者OBS直播软件,如还未下载,可进入...
  19. 物理渲染数学(s2013_pbs_physics_math_notes)
  20. python中使用缩进来体现代码之间的逻辑关系_Python使用缩进来体现代码之间的逻辑关系。...

热门文章

  1. 5、提交报告获取服务、状态报告获取服务 -功能详细设计 --短信平台
  2. 对于有Id,ParentId,Name这样类型字段的表的一个sql查询
  3. Docker镜像保存save、加载load
  4. 在某个文件夹中打开 cmd黑窗口
  5. 第11章 支撑向量机 SVM 学习笔记 下 高斯核函数RBF
  6. 190616每日一句
  7. 181011词霸扇贝有道每日一句
  8. Atitit 微服务 分布式 区别 微服务的判断标准 目录 1.1. 区别 微服务侧重于微小服务进程隔离级别,分布式侧重于机器隔离 1 2. 微服务是一种架构, 。多微才叫微? 1 2.1. 微服务
  9. Atitit 大数据索引技术attilax总结 目录 1. 面临的问题 2 1.1. 找到太多数据 2 1.2. 不支持多字段搜索 2 1.3. 不支持模糊搜索 2 1.4. 聚合搜索 2 1.5
  10. Atitit 得到mybatis 实际 sql 1.1. 使用mybatis工具提供的,只能出现问号一大堆不行 1 1.2. 配置log 打印sql依然不行,里面有问号。。 4 1.3. 配置p