⛄一、案例简介

本文基于Matlab设计实现了一个文本相关的声纹识别系统,可以判定说话人身份。
1 系统原理
a 声纹识别
这两年随着人工智能的发展,不少手机App都推出了声纹锁的功能。这里面所采用的主要就是声纹识别相关的技术。声纹识别又叫说话人识别,它和语音识别存在一点差别。

b 梅尔频率倒谱系数(MFCC)
梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficient, MFCC)是语音信号处理中最常用的语音信号特征之一。
实验观测发现人耳就像一个滤波器组一样,它只关注频谱上某些特定的频率。人耳的声音频率感知范围在频谱上的不遵循线性关系,而是在Mel频域上遵循近似线性关系。
梅尔频率倒谱系数考虑到了人类的听觉特征,先将线性频谱映射到基于听觉感知的Mel非线性频谱中,然后转换到倒谱上。普通频率转换到梅尔频率的关系式为:

c 矢量量化(VectorQuantization)
本系统利用矢量量化对提取的语音MFCC特征进行压缩。
VectorQuantization (VQ)是一种基于块编码规则的有损数据压缩方法。事实上,在 JPEG 和 MPEG-4 等多媒体压缩格式里都有 VQ 这一步。它的基本思想是:将若干个标量数据组构成一个矢量,然后在矢量空间给以整体量化,从而压缩了数据而不损失多少信息。
3 系统结构
本文整个系统的结构如下图:
3.1 训练过程
首先对语音信号进行预处理,之后提取MFCC特征参数,利用矢量量化方法进行压缩,得到说话人发音的码本。同一说话人多次说同一内容,重复该训练过程,最终形成一个码本库。
3.2 识别过程
在识别时,同样先对语音信号预处理,提取MFCC特征,比较本次特征和训练库码本之间的欧氏距离。当小于某个阈值,我们认定本次说话的说话人及说话内容与训练码本库中的一致,配对成功。

4 测试实验




可以看到只有说话人及说话内容与码本库完全一致时才会显示“密码正确”,否则显示“密码错误”,实现了声纹锁的相关功能。

⛄二、部分源代码

function varargout = GUI(varargin)

gui_Singleton = 1;
gui_State = struct(‘gui_Name’, mfilename, …
‘gui_Singleton’, gui_Singleton, …
‘gui_OpeningFcn’, @GUI_OpeningFcn, …
‘gui_OutputFcn’, @GUI_OutputFcn, …
‘gui_LayoutFcn’, [] , …
‘gui_Callback’, []);
if nargin && ischar(varargin{1})
gui_State.gui_Callback = str2func(varargin{1});
end

if nargout
[varargout{1:nargout}] = gui_mainfcn(gui_State, varargin{:});
else
gui_mainfcn(gui_State, varargin{:});
end
% End initialization code - DO NOT EDIT

% — Executes just before GUI is made visible.
function GUI_OpeningFcn(hObject, eventdata, handles, varargin)
% This function has no output args, see OutputFcn.

% varargin command line arguments to GUI (see VARARGIN)

% Choose default command line output for GUI
handles.output = hObject;

% Update handles structure
guidata(hObject, handles);

% UIWAIT makes GUI wait for user response (see UIRESUME)
% uiwait(handles.figure1);

% — Outputs from this function are returned to the command line.
function varargout = GUI_OutputFcn(hObject, eventdata, handles)
% Get default command line output from handles structure
varargout{1} = handles.output;

% — Executes on button press in trainrec.
function trainrec_Callback(hObject, eventdata, handles)
speaker_id = trainrec();
set(handles.train_current,‘string’,‘Hurraay,DONE!’);
speaker_iden = sprintf(‘you re speaker number %d’, speaker_id);
% set(handles.speaker,‘string’,speaker_iden);
set(handles.access,‘BackgroundColor’,‘blue’);
set(handles.access,‘string’,‘YOU HAVE ACCESS, TRAIN COMMANDS NOW!’);

% if access_ == 1
% set(handles.access,‘string’,‘YOU HAVE ACCESS, TRAIN COMMANDS NOW!’);
% else
% set(handles.access,‘string’,‘YOU DONT HAVE ACCESS,SPEAKER NOT RECOGNIZED!’);
% end
% — Executes on button press in command.
function command_Callback(hObject, eventdata, handles)
trai_pairs=30;
out_neurons=5;
hid_neurons=6;
in_nodes=13;
eata=0.1;emax=0.001;q=1;e=0;lamda=.7; t=1;
load backp.mat W V;
recObj = audiorecorder;
Fs=8000;
Nseconds = 1;

while(1)
fprintf(‘say any word immediately after hitting enter’);
input(‘’);
recordblocking(recObj, 1);
x = getaudiodata(recObj);
[kk,g] = lpc(x,12);
Z=(kk);
Z=double(Z);
p1=max(Z);
Z=Z/p1;

for p=1:trai_pairs

z=transpose(Z(p,:));

% calculate output
y=(tansig(V*(z)));
o=(tansig(W*(y)));
break
end

b=o(1);
c=o(2);
d=o(3);
e=o(4);
f=o(5);
a= max(o);
if (b==a )display('AHEAD');set(handles.ahead,'BackgroundColor','green'); set(handles.command,'string','Ahead'); pause(2);
elseif (c== a)display('STOP');set(handles.stop,'BackgroundColor','green'); set(handles.command,'string','Stop'); pause(2);
elseif (d== a)display('BACK');set(handles.back,'BackgroundColor','green'); set(handles.command,'string','Back'); pause(2);
elseif (e==a)display('LEFT');set(handles.left,'BackgroundColor','green'); set(handles.command,'string','Left'); pause(2);
elseif (f==a)display('RIGHT');set(handles.right,'BackgroundColor','green'); set(handles.command,'string','Right');pause(2);
end
set(handles.ahead,'BackgroundColor','white');

set(handles.left,‘BackgroundColor’,‘white’);
set(handles.right,‘BackgroundColor’,‘white’);
set(handles.stop,‘BackgroundColor’,‘white’);
set(handles.back,‘BackgroundColor’,‘white’);

end
function traincommands()
Fs=8000;
Nseconds = 1;
samp=6;
words=5;
recObj = audiorecorder;
aheaddir = ‘C:\Users\Rezetane\Desktop\HRI Proj\Speech-Recognition-master\data\train_commands\ahead’;
backdir = ‘C:\Users\Rezetane\Desktop\HRI Proj\Speech-Recognition-master\data\train_commands\back’;
stopdir = ‘C:\Users\Rezetane\Desktop\HRI Proj\Speech-Recognition-master\data\train_commands\stop’;
rightdir = ‘C:\Users\Rezetane\Desktop\HRI Proj\Speech-Recognition-master\data\train_commands\right’;
leftdir = ‘C:\Users\Rezetane\Desktop\HRI Proj\Speech-Recognition-master\data\train_commands\left’;
s_right = numel(dir([rightdir ‘*.wav’]));

for i= 1:1:samp

filename = sprintf(‘%ss%d.wav’, aheaddir, i);
fprintf('Reading %ss%d ',aheaddir,i);
[x,Fs] = audioread(filename);
[s(i,:),g] = lpc(x,12);
end

for i= (samp+1):1:2*samp

filename = sprintf(‘%ss%d.wav’, stopdir, i- samp);
fprintf('Reading %ss%d ',stopdir,i);
[x,Fs] = audioread(filename);
[s(i,:),g] = lpc(x,12);
%plot(s(i,:));
end

for i= (2samp+1):1:3samp
filename = sprintf(‘%ss%d.wav’, backdir, i-2*samp);
fprintf('Reading %ss%d ',backdir,i);
[x,Fs] = audioread(filename);
[s(i,:),g] = lpc(x,12);
end

for i= (3samp+1):1:4samp
filename = sprintf(‘%ss%d.wav’, leftdir, i-3*samp);
fprintf('Reading %ss%d ',leftdir,i);
[x,Fs] = audioread(filename);
[s(i,:),g] = lpc(x,12);
end

for i= (4samp+1):1:5samp

filename = sprintf(‘%ss%d.wav’, rightdir, i- 4*samp);
fprintf('Reading %ss%d ',rightdir,i);
[x,Fs] = audioread(filename);
[s(i,:),g] = lpc(x,12);
end

S=zeros(1,13);
for i=1:1:samp
S=cat(1,S,s(i,:));
S=cat(1,S,s(samp+i,:));
S=cat(1,S,s(2samp+i,:));
S=cat(1,S,s(3
samp+i,:));
S=cat(1,S,s(4*samp+i,:));
end
S(1,:)=[];
save speechp.mat S
trai_pairs=30; % 48 samples
out_neurons=5; % no of words
hid_neurons=6; %matka
in_nodes=13; %features are 13
eata=0.1;emax=0.001;q=1;e=0;lamda=.7; t=1;

load speechp.mat S

p1=max(max(S));
s=S/p1;

Z= double(s);

dummy=[1 -1 -1 -1 -1;
-1 1 -1 -1 -1;
-1 -1 1 -1 -1;
-1 -1 -1 1 -1;
-1 -1 -1 -1 1];

t=trai_pairs/out_neurons;
D=dummy;
for i= 1:1:5
D=cat(1,D,dummy);
end

⛄三、运行结果

⛄四、matlab版本及参考文献

1 matlab版本
2014a

2 参考文献
[1]韩纪庆,张磊,郑铁然.语音信号处理(第3版)[M].清华大学出版社,2019.
[2]柳若边.深度学习:语音识别技术实践[M].清华大学出版社,2019.

3 备注
简介此部分摘自互联网,仅供参考,若侵权,联系删除

【语音识别】基于matlab GUI智能语音识别门禁系统【含Matlab源码 596期】相关推荐

  1. [附源码]计算机毕业设计Python+uniapp安卓门禁系统appo8yd7(程序+源码+LW+远程部署)

    [附源码]计算机毕业设计Python+uniapp安卓门禁系统appo8yd7(程序+源码+LW+远程部署) 该项目含有源码.文档.程序.数据库.配套开发软件.软件安装教程 项目运行环境配置: Pyt ...

  2. 基于STM32的智能宠物看护喂养系统(程序源码+原理图+PCB+Boom表+实物操作说明)

    基于STM32的智能宠物看护喂养系统(程序源码+原理图+PCB+Boom表+实物操作说明) **0  引言** 随着我国经济的快速发展,人们的生活水平不断提高,饲养宠物已经成为成为一种潮流.目前,市场 ...

  3. 【指纹识别】基于模板匹配实现指纹识别门禁系统含Matlab源码

    1 简介 近年来,随着识别技术和网络技术的飞速发展,门禁系统也得到了飞跃式的发展,出现了基于指纹识别的门禁系统.这种系统具有安全性,方便性和易管理性等特点,是确保各重要部门出入口安全的有效措施,现已广 ...

  4. 【人脸识别】基于主成分分析PCA算法人脸识别门禁系统含Matlab源码

    1 简介 人脸是反应人身份的最直接的,最可靠的信息资源.通过人脸我们可以很快辨识一个人,这就是所谓的人脸识别.最初的人脸研究人员是一些从事社会心理学的工作者,从20世纪50年代开始有一些文献资料陆续发 ...

  5. 基于stm32的智能防疫门禁管理系统

    1.选题背景与意义 经过了疫情的开端与发展,就目前我国已经处在疫情的常态化管理中.在疫情常态化管理下,与人们日常生活中的出行,总离不开测温.通行证明等等. 针对当前的疫情形式,我们设计一款智能防疫门禁 ...

  6. 基于JAVA政府机关门禁管理系统计算机毕业设计源码+系统+数据库+lw文档+部署

    基于JAVA政府机关门禁管理系统计算机毕业设计源码+系统+数据库+lw文档+部署 基于JAVA政府机关门禁管理系统计算机毕业设计源码+系统+数据库+lw文档+部署 本源码技术栈: 项目架构:B/S架构 ...

  7. 智能门禁(3)---汉王智能人脸门禁系统

    汉王智能人脸门禁系统方案

  8. 基于STM32的多功能门禁系统(AS608指纹识别、密码解锁、刷卡解锁)

    目录 一.项目功能 二.视频 三.原理图 4.材料选择 5.部分程序 资料下载地址:基于STM32的多功能门禁系统 一.项目功能 1.AS608指纹解锁:可以录入.删除.验证指纹: 2.密码解锁:可以 ...

  9. 【机械仿真】基于matlab GUI曲柄摇杆机构运动仿真【含Matlab源码 1608期】

    一.获取代码方式 获取代码方式1: 完整代码已上传我的资源:[机械仿真]基于matlab GUI曲柄摇杆机构运动仿真[含Matlab源码 1608期] 点击上面蓝色字体,直接付费下载,即可. 获取代码 ...

  10. 一种基于嵌入式的多重识别门禁系统设计方案

    一种基于嵌入式的多重识别门禁系统设计方案 1. 前言 门禁系统已广泛的应用在各行各业,随着社会经济的发展,人们对门禁系统的要求越来越高,设计更加安全.更加方便的门禁系统势在必行.由于不同企业对于门禁系 ...

最新文章

  1. Normalization 的发展历程
  2. android build系统
  3. 城市规划理论1 选址理论
  4. 【数理知识】《积分变换与场论》王振老师-第3章-矢量与矢量空间
  5. PAT甲级1120 Friend Numbers:[C++题解]set去重且有序
  6. 深入理解linux系统的目录结构
  7. 《腾讯传》读后感一——时势造英雄
  8. 二进制数据与16进制字符串相互转化方法
  9. 我从编程总结的 22 个经验
  10. 利用jmeter做一个简单的性能测试并进行参数化设置
  11. 互联网创业的重重风险
  12. html点击文本框唤醒手机键盘,html移动应用 input 标签 清除按钮功能如何实现(不触发键盘)...
  13. YASKAWA 安川变频器调试软件支持多种机型
  14. 关于需求跟踪矩阵的6个问题
  15. 移动apn接入点哪个快_4g网速最快的apn接入点 如图所示
  16. 20165219王彦博课上考试总结
  17. 模拟外线O口呼入时,看不到来电显示号码?
  18. Spark 3.0 - 6.ML 自定义 Transformer 踩坑大全
  19. 市场调研报告-全球与中国教育互动白板市场现状及未来发展趋势
  20. .net5 开启Lucene的全文搜索之旅

热门文章

  1. python求本原根
  2. Android8.1 ifw方案,Android8.1系统修改串口节点
  3. java使用循环打印平行四边形、三角形、棱形、空心棱形
  4. oracle runc n m,19cRAC增删节点
  5. sendRedirect()与foward
  6. Flutter工具类 (二) 图片加载框架
  7. Redis基于dockerfile的容器部署
  8. 一文看懂博睿数据AIOps场景、算法和能力
  9. kendoui ajax,KendoUI Grid绑定数据
  10. 怎样把照片中的头像扶正_特别亲子照,一家三口、四口微信头像,温馨幸福