语音端点检测 php,几种语音端点检测方法简介
几种语音端点检测方法简介
2011年第11期福建电脑
67
几种语音端点检测方法简介
邢亚从
(苏州市职业大学江苏苏州215000)
【摘要】:语音的端点检测在语音的编码、语音识别、语音增强、说话人识别中起着非常重要的作用,直接影响着后续工作的正确率。本文在双门限检测法的基础上,介绍了基于自相关极大值和基于小波变换的端点检测方法,阐述其优缺点。
【关键词】:语音端点检测、过零率、小波变换、自相关极大值端点检测是语音识别中非常重要的一步。所谓语音端点检测,就是从一段给定的语音信号中找出语音的起始点和结束点。在语音识别系统中,正确、有效的进行端点检测不仅可以减少计算量和缩短处理时间,而且能排除无声段的噪声干扰、提高语音识别的正确率。研究表明[1],即使是在安静的环境下,语音识别系统一半以上的错误可能主要来源于端点检测。除此之外,在语音合成、编码等系统中,高效的端点检测也直接影响甚至决定着系统的主要性能。因此,端点检测的效率、质量在语音处理系统中显得至关重要,广泛开展端点检测实现手段方面的研究,有一定的现实意义[2]。1、双门限检测法
语音端点检测方法可采用测试信号的短时能量或短时对数能量、联合过零率等特征参数,并采用双门限判定法来检测语音端点,即利用过零率检测清音,用短时能量检测浊音,两者配合。首先为短时能量和过零率分别确定两个门限,一个是较低的门限数值较小,对信号的变化比较敏感,很容易超过;另一个是比较高的门限,数值较大。低门限被超过未必是语音的开始,有可能是很短的噪声引起的,高门限被超过并且接下来的自定义时间段内的语音超过低门限,意味着信号开始[5]。
算法过程如下:
(1)在开始阶段要做预加重和分帧的处理,讲语音信号分成一帧一帧的,分帧处理有利于对语音信号进行准确的分析,并且能够提高识别率,这时再分别求出每帧的短时能量和短时过零率。
(2)接着要设置初始化参数,比如最大静音长度,这是一个经验值,用来判断语音段是否结束,论文中是根据大量的语音样本的长短设置的一个经验值。另外,短时能量和短时过零率的门限也要设置初始值等。
(3)判断当语音在静音段或者是过渡段时,如果语音信号的短时能量值大于短时能量的高门限,或者语音信号的短时过零率大于短时过零率的高门限,那么就确认进入了语音段,如果短时能量的值大于短时能量的低门限或者过零率的值大于过零率的低门限,那么语音处于过渡段,否则,语音仍就处于静音段。
(4)当语音信号在语音段时,判断如果短时能量的
值大于短时能量的低门限或者短时过零率的值大于短时过零率的低门限,那么语音信号仍然处于语音段。
(5)如果静音长度小于设置的最大静音长度,那么就表明语音还尚未结束,还在语音段,如果语音的长度小于最小噪声长度,那么认为语音太短,此时是噪声,同时判断语音处于静音段;否则语音就进入结束段。2、基于自相关极大值的语音端点检测方法
在端点检测中,如果所处理的语音信号是非平稳的随机过程s(n),可以采用短时自相关函数,它的定义为
它的归一化自相关函数定义为
这里之所以要将自相关函数归一化是为了在语音端点检测过程中不用考虑信号绝对能量的大小所带来的影响。我们知道语音是由浊音和清音两部分组成的。浊音语音是0~10ms内可以被看作为一个准周期信号,而清音信号接近于随机噪声。由于语音的绝大部分能量都集中在浊音语音部分,因此语音可以在10~20ms内被看作为一个准周期信号,那么它的归一化自相关函数也呈准周期性,而高斯白噪声信号的归一化自相关函数的分布较为平均和分散,不具有准周期性。
为了突出带噪语音信号的归一化自相关函数的准周期性和高斯白噪声信号的归一化自相关函数分散性,可以利用一个低通滤波器除去波形上的高频毛刺。这样我们就可以清晰地看到带噪语音信号自相关函数所具有的准周期性。图1(a)为带噪语音信号的归一化自相关函数经过低通滤波后的典型波形。图1(b)为高斯白噪声信号的归一化自相关函数经过低通滤波后的典型波形。我们看到带噪语音信号的自相关函数的能量将集中在基音周期的各个整数倍点上,在这些点附近将出现极大值,并且此函数在零点处必将出现最大值。而高斯白噪声信号的自相关函数却不具有准周期性,它的归一化自相关函数的能量在零点之外较为平均和分散。从图1中我们可以清晰地看到带嗓语音信
语音端点检测 php,几种语音端点检测方法简介相关推荐
- 几种常用的差异分析方法简介
几种常用的差异分析方法简介 如今在生物学研究中,差异分析越来越普遍,也有许多做差异分析的方法可供选择.但是在实际应用中,大多数人不知道该使用哪种方法来处理自己的数据,所以今天我就来介绍下目前几种常用的 ...
- 倒谱法的基因周期检测matlab,两种基音周期检测方法
很好很强大@! 基音周期中两种算法 常用的基音周期检测方法-自相关函数法.倒谱法.平均幅度差函数法都属于非基于事件基音检测方法,都先将语音信号分为长度一定的语音帧,然后对每一帧语音求平均基音周期,它们 ...
- ISPRS2021/遥感影像云检测:一种地理信息驱动的方法和一种新的大规模遥感云/雪检测数据集
ISPRS2021/云检测:A geographic information-driven method and a new large scale dataset for remote sensin ...
- 皮带撕裂检测matlab,一种皮带撕裂检测方法与流程
本发明涉及皮带检测技术领域,特别涉及一种皮带撕裂检测方法. 背景技术: 皮带运输系统是现代工业生产中运输物料的重要手段.在皮带运输过程中,如果出现皮带撕裂的情况,不仅影响物料的运输.造成浪费和污染,而 ...
- 实时检测攻击行为 9种IDS入侵检测系统方法
入侵检测系统,英文简写为IDS,顾名思义,它是用来实时检测攻击行为以及报告攻击的.如果把防火墙比作守卫网络大门的门卫的话,那么入侵检测系统(IDS)就是可以主动寻找罪犯的巡警. 因而寻求突破IDS的技 ...
- pr文字转语音有插件吗_3种方法,免费让你的文字变成语音!
好多人问我,在做视频时,配音不喜欢用自己的声音,有没有好的配音工具呢?来了来了,它们来了.当然有了,为大家推荐3款,两款PC端,一款手机端.重点是,这3种文字转语音的工具完全免费,而且操作简单. 1. ...
- 语音识别端点检测matlab,关于语音识别的端点检测问题
这是我的端点检测程序,语音是6个连续字,执行后却只检测了一个字的端点,求大神指点哪里的错 %读入语音 [x,fs,bits]=wavread('D:\voice\openleft.wav'); %增益 ...
- 一种语音控制PPT翻页系统的制作方法
本实用新型属于智能语音领域,特别是涉及一种语音控制PPT翻页系统. 背景技术: 随着计算机技术.投影技术和网络技术的发展,各行各业的工作已经离不开计算机的参与.多媒体演示已经受到了人们的广泛应用.而多 ...
- android ios语音转码,手机如何将语音转文字?这几种方法真简单,安卓苹果通用...
原标题:手机如何将语音转文字?这几种方法真简单,安卓苹果通用 手机可以将语音转文字吗? 当然可以啦,方法还不止一种,下面就简单给大家介绍几种,安卓苹果手机通用的方法吧. 1.输入法-实时语音转文字 手 ...
最新文章
- 定时登录下载sftp服务器上的某些有规则的文件
- linux 公钥登录
- bzoj2426 [HAOI2010]工厂选址 读题+贪心
- Python统计共同参演电影最多的演员组合
- Delphi中Messagedlg用法
- Windows 2012部署Exchange2013
- Linux 之CentOS7-VSFTP搭建
- Octotree插件安装及API limit exceeded报错
- Dw cs6的详细下载安装教程对网页设计需要cs6的同学
- 机器学习数据集划分方法
- 和平精英灵敏度分享码服务器没有响应,和平精英灵敏度分享码怎么弄 灵敏度分享码怎么用...
- Java中Date日期时间的工具类
- 武汉大学计算机学院 论文,武大计算机学院教授分享:学术论文投稿与Rebuttal经验...
- 输入相应的数打印三角形
- 2023年5种最适合网络安全工程师学习运用的编程语言
- 用python画一个糖葫芦
- android打地鼠设计报告,android开发中利用handler制作一个打地鼠小游戏
- 安徽大学计算机考研考情与难度、参考书及上岸前辈备考经验指导
- [长安战疫-cazy] Web题解
- 今天一不小心,把抖爸爸给爬了