一、       概念介绍

短时过零率可以看做信号频率的简单度量,是谱特性的一种粗略估计。

(1)    过零就是指信号通过零值。过零率就是指每秒内信号值通过零值的次数

(2)    对于离散时间序列,过零则是指信号取样值改变符号,过零率则是每个样本改变符号的次数。对于声音信号,则是指一帧声音中语声音信号波形穿过横轴的次数,可以用相邻两个取样值改变符号的次数来计算。

二、       计算公式

其中,N是一帧的采样点数,sgn[ ]为符号函数,即

三、       MATLAB程序

sgn.m

%% sgm.m
function z = sgn(x)
if x>=0z=1;
elsez=-1;
end

短时过零率提取程序

clear all
clf
close all
[x fs]=audioread('D:\experiment\soundclassify\training\glass\2.wav'); %读取音频信号 x为信号样本,fs信号采样频率
%%%%%%%%%%%%%判断并合并单双声道%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%if size(x,2)>1x=x(:,1);
endframe=enframe(x,1024,512);%分帧 帧长1024 帧移512
zcr_sum=0;%变量保存过零点数
for i=1:size(frame,1) y=frame(i,:);%每帧数据 s=y'.*hamming(1024);%加汉明窗窗
%%%%%%%%%%%%%%%%%%%%%计算过零率%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% for j=1:size(s,1)-1 zcr_sum=zcr_sum+abs(sgn(s(j+1))-sgn(s(j))); end zcr_sum=zcr_sum/2; m(:,i) = zcr_sum;%将每帧的过零率保存到变量m中
end
figure(1)
plot(m)
xlabel('帧数/帧');
ylabel('过零数');
title('短时平均过零率')

(有错误,请批评指正)

声事件识别之时域短时过零率相关推荐

  1. 语音短时过零率计算——Python实现

    概念 上一篇文章介绍了语音短时能量,这篇介绍一下语音的短时过零率.短时过零率也是一个比较基础的语音时域特征,下面就来介绍一下. 短时过零率就是单位时间穿过坐标系横轴的次数,计算公式如下: Zn=∑m= ...

  2. 音频信号特征提取(1):短时特征之短时能量、短时功率、短时过零率

    特征提取(Feature Exaction)的重要性,就不用多说了. 对于音频信号,按时间分辨率.按局部or全局的观念.持续时间长短,或者爱怎么讲怎么讲,特征可分为长期(long-term).中期(m ...

  3. python求语音信号短时能量、短时过零率、语谱图

    python语音信号处理(二) 一.短时能量 短时能量主要用于区分浊音段和清音段,因为浊音时E(i)值比清音时大得多:区分声母与韵母的分界和无话段与有话段分界. 计算第i帧语音信号yi(n)的短时能量 ...

  4. matlab短时过零率计算+源代码

    [xx,Fs]=audioread('mei.wav'); % 读入数据文件 x=xx-mean(xx); % 消除直流分量 wlen=200; inc=80; % 设置帧长.帧移 win=hanni ...

  5. 声纹识别技术发展现状及未来五大发展趋势

    走出实验室的声纹识别技术因其广阔的应用场景和价值,从特定领域到民用领域,在国内外正迎来第一波商用化浪潮. 而与此同时,关于声纹识别技术研究的成熟度以及安全可靠性,一直是应用领域讨论的重点,本文基于时下 ...

  6. 声纹识别技术五大发展趋势总结

    走出实验室的声纹识别技术因其广阔的应用场景和价值,从特定领域到民用领域,在国内外正迎来第一波商用化浪潮. 而与此同时,关于声纹识别技术研究的成熟度以及安全可靠性,一直是应用领域讨论的重点,本文基于时下 ...

  7. 语音识别-过零率和短时能量-端点检测

    端点检测 个人理解 能量与过零数的端点检测算法步骤 语音信号x(n)进行分帧处理 计算每一帧的短时能量,得到语音的短时帧能量 计算每一帧语音的过零数,得到短时帧过零数 考擦语音的平均能量设置一个较高的 ...

  8. matlab 端点检测 能零比法_基于短时能量与过零率的端点检测的matlab分析

    基于语音端点检测的方法有很多,从历史的发展来看. 首先是基于短时能量和短视过零率的端点检测=〉各变换域=〉人工神经网络=〉基于倒谱距离的检测算法=〉基于谱熵的方法=〉几何门限的方法=〉sigma函数= ...

  9. 说话人识别/声纹识别学习路径的资料整理,从零学声纹识别

    这是2年前我的总结,有点与最新方法和方向脱轨, 这两年内声纹识别/说话人识别已经又有很多新的方法出现, 等我看看论文和一些实验, 后面更新一波声纹识别的东西 ===================== ...

  10. [深度学习概念]·声纹识别技术简介

    声纹识别技术简介 声纹识别,也称作说话人识别,是一种通过声音判别说话人身份的技术.从直觉上来说,声纹虽然不像人脸.指纹的个体差异那样直观可见,但由于每个人的声道.口腔和鼻腔也具有个体的差异性,因此反映 ...

最新文章

  1. Python 2.x 与 Python 3.x 的区别
  2. R语言ggplot2可视化柱状图并自定义柱体的宽度(通过变量指定条形的宽度)实战、条形图并自定义条形的宽度实战
  3. 阿里达摩院包揽AI领域六大权威榜单冠军:用人类的学习方式超越人类
  4. 【Linux】一步一步学Linux——adduser命令(83)
  5. JS通用窗口拖动函数
  6. SAP Spartacus读取User Address的action是如何被Effect接收的
  7. CSHOP后台设置SMTP发邮件提示 Error: need RCPT command 错误解决
  8. jvm 内存镜像_镜像镜像–使用反射在运行时查看JVM内部
  9. 对当前目录及子目录下的所有源码文件及Makefile打包
  10. ElasticSearch入门教程-索引
  11. 仿MIUI音量变化环形进度条实现
  12. Thread.sleep(0) 到底有什么用?
  13. typora下载百度网盘
  14. 1 -- > PCI / PCIe 配置空间详解
  15. 用地预审与选址意见书
  16. 拼图、jquery拼图、javascript拼图
  17. 为什么我越来越喜欢画低保真原型?
  18. 下载工具:aria2c
  19. 预失真算法matlab实现,2013-全国研究生数学建模B题-seleh模型预失真MATLAB仿真代码...
  20. Bigtable学习翻译

热门文章

  1. ipv6无网络访问权限可行解决方案
  2. javacc LOOKAHEAD关键字
  3. LookaHead优化器
  4. 什么是广域网(WAN、公网、外网),什么是局域网(LAN、私网、内网)
  5. 将APPDATA 迁出C盘
  6. SpringBatch 实列学习《一》
  7. 上周六香山游兄弟们的合影
  8. Ubuntu 和NVIDIA显卡的兼容问题解决
  9. 为何天搜科技这些互联网企业对杭州情有独钟?
  10. AD7705模数转换芯片工作原理