浅谈语音信号处理系列之二 语音信号处理的基础
下面简单扼要的总结几个基本概念,如果想深入了解请告诉我或者直接参考相关文献。
一 语音信号的产生
一般来说,声音是通过振动产生的。同样,语音是肺里面的空气形成气流通过声道,再从口
鼻辐射而产生的。语音信号主要是由三种成分组成:浊音、清音和爆破音组成,这三种不同
的发音取决于声带的振动和发音器官(口鼻舌等)的位置和状态。如果用信号系统的角度来
看,气流通过声门(声带)形成激励源,从声门到口鼻这段腔体是一个时变的系统,当然语
音就是输出的时变信号了。只有搞清楚激励源和时变系统的特性,才能真正明白语音信号的
产生,从而进行更深入的研究。
二 描述语音特性的几个概念
1、物理属性:
1)音调:音高,是声音振动的频率;
2)音强:音量,声音震动的强弱;
3)音长:声音的长短;
4)音色:音质,声音的内容和特质,与声带振动频率、激励源和声道的形状等有
关。
2、基本单位
1)最基本的单位:音素,分为浊音和清音。
2)最小发音单位:音节,由音素组成。音节=元音+辅音,而没有说音节=浊音+清
音,这是因为二者不是一个领域范畴的表述,一个是语言学构成,另一个是语音成分组成,
另外辅音分为清辅音和浊辅音,元音和浊辅音表示了声带振动,清辅音声带不振动。
3)汉语语音=声母+韵母+音调
3、共振峰特性
当振动频率与系统的固有频率一致时,就会引起共振现象。声道是一个具有某种谐振特性的
腔体,可以与语音在多个频率上发生谐振,这些谐振的位置称为共振峰,它对语音信号产生
了很大的影响。
4、掩蔽效应
从人耳的感知特性出发,是一种心理声学现象,以后会再详细介绍。
三 语音信号与音频信号的关系
语音信号的频率范围是200~3400Hz左右,人们可听到的音频信号范围是20~20KHz,显然语音
信号属于音频信号,那为什么还特别强调语音信号的研究呢?
1、语音信号和音频信号的处理对象不同,语音信号主要是以人发声为研究对象,而音频信
号则是以自然界所有的声音为研究对象;
2、研究方法不同,语音信号主要从人的发声机理为基础,建立发声系统模型,分析系统特
性;而音频信号的来源太多了,所以它是以人的听觉特性为基础,建立人耳系统模型,分析
系统特性。
3、语音信号具有更多的实际研究价值和应用价值。
四 语音信号处理的常用技术
1、时域分析
通过将语音信号分帧,转化时变信号为时不变信号以进行处理。
1)短时能量
2)短时平均过零率
3)短时自相关运算
2、频域分析
1)傅里叶变换(FFT)
2)滤波器组(Filter Bank)
3)基于听觉特性的Mel频率倒谱分析
4)基于线性预测(LPC)的倒谱分析
3、两个关键参数
1)基音频率(Pitch)
2)线性预测系数(LPC)
五 语音信号处理的常用软件
1、Matlab
2、Cool Edit
浅谈语音信号处理系列之二 语音信号处理的基础相关推荐
- 浅谈Dynamic 关键字系列之二:调用属性,方法,字段
新建类Product: class Product {public string name;public int Id { get; set; }public void ShowProduct(){C ...
- 浅谈ARM Cortex-M系列架构——架构篇
浅谈ARM Cortex-M系列架构文章 浅谈ARM Cortex-M系列架构--指令集 目录 前言 1.操作状态 2.操作模式 二.寄存器 1.通用目的寄存器 2.R13,栈指针(SP) 3.R14 ...
- 浅谈Dynamic 关键字系列之三(下):ExpandoObject,DynamicObject,DynamicMetaObject
接上文:浅谈Dynamic关键字系列之三(上) 为什么TryXXX方法没有被调用?? 将DynamicProduct 中的name修饰符改为private: private string name; ...
- 袁萌浅谈C919大飞机(二)
袁萌浅谈C919大飞机(二) 2015年11月2日,C919大飞机从生产线上下来.从此,C919大飞机的机体算是诞生了.至于这个大家伙会不会"飞"起来,当时人们还不知道. 人们的预 ...
- NFT系列#2 - 浅谈你不知道的加密艺术史(二)
导读:2016年诞生的Rare Pepe Wallet开辟了通往加密艺术的路.到了2017年,随着比特币第三轮牛市的到来,越来越多的加密艺术项目乘着币价的东风崭露头角.不同的是,它们抛弃了比特币网络, ...
- 浅谈PCI Express体系结构(二)
PCI总线的信号定义 PCI总线是一条共享总线,在一条PCI总线上可以挂接多个PCI设备.这些PCI设备通过一系列信号与PCI总线相连,这些信号由地址/数据信号.控制信号.仲裁信号.中断信号等多种信号 ...
- 浅谈——网络安全架构设计(二)
(34条消息) 浅谈--网路安全架构设计(一)_孤城286的博客-CSDN博客 目录 一.实现需求: 二.安全优化: (1)修改后网络架构 (2)安全评估: 三.再优化 (1)优化方案 (2)防火墙区 ...
- 话里话外:浅谈国企绩效考核问题(二)
企业在进行绩效考核的过程中,很容易忽略一些问题: 一.对绩效考核认识不足: 绩效考核是企业管理的重头戏,它可以使企业的活动更加高效,提升员工的积极性.但与此同时,绩效考核也是一把双刃剑,绩效考核制度的 ...
- 痞子衡嵌入式:浅谈i.MXRT1xxx系列MCU时钟相关功能引脚的作用
大家好,我是痞子衡,是正经搞技术的痞子.今天痞子衡给大家介绍的是i.MXRT1xxx系列MCU时钟相关功能引脚作用. 如果我们从一颗 MCU 芯片的引脚分类来看芯片功能,大概可以分为三大类:电源.时钟 ...
最新文章
- XML专题:使用NSXMLParser解析xml文件
- jquery源码解析:jQuery数据缓存机制详解2
- boost::safe_numerics::automatic相关的测试程序
- 护理方面关于人工智能的构想_如何提出惊人的AI,ML或数据科学项目构想。
- http请求中get和post方法的区别
- 查看mysql某人执行了什么语句_一条 SQL 语句是如何在 MySQL 中执行的
- 固阳一中2021高考成绩查询,中考志愿填报网站
- 用计算机探索规律概括,《用计算器探索规律》优秀教学设计
- ITIL学习笔记——核心流程之:IT服务连续性管理
- 如何从PayPal提现
- 贝壳找房APP安装包瘦身
- 解决键盘模式(布局)的错误导致的部分键位失灵或异常(姑且这样描述问题吧)
- 椭圆机的减肥效果怎么样
- 使用MapReduce统计一篇微博数据的点赞次数,并且输出前五个最高的点赞数量。
- python音乐相册_python爬虫之爬取网易云音乐的歌曲图片和歌词
- 已解决(Python安装报错)Visit python.org to download an earlier version of Python.
- [Unity]读取本地图片ArgumentException: A null reference or invalid value was found错误
- 天然河道水面线系统怎么用_天然河道水面线系统简介
- linux的内核兼容,各种glibc和Linux内核版本的兼容性
- 物流智能机器人—结合WMS系统进行通讯的海格里斯(HEGERLS)单轨环形RGV穿梭车
热门文章
- SQL Server错误18456,window身份验证登录失败解决办法
- 一份特殊的申请书--------纪念我可能会失去的书生意气
- 本地文件怎么复制到云服务器,本地文件如何复制到云服务器上
- 动态规划总结(01背包 完全背包 多重背包)
- 如何解除WORD限制编辑
- Bootstrap后台开发模板整理
- ClassCastException: java.lang.String cannot be cast to com.alibaba.fastjson.JSONObject 的解决办法
- 定义一个图形类及其子类,计算其面积和周长
- 计算机网络名词解释www万维网,网络名词解释
- 《夜深人静写算法》总纲