一、语音的产生

  1. 语音产生过程:激励-调制模型(Exicitation-Modulation Model)/源-滤波模型(Source-Filter Model)
  • 激励(声源):肺部产生气流,通过猴头时冲击声带,使声带产生振动;
  • 调制(调音):声带振动引起气流疏密变化,并在口腔和鼻腔中产生共鸣,这一共鸣会导致气流的疏密模式发生变化。
  • 最后,这些疏密相间的模式由口唇辐射出来,产生我们听到的语音(周期性变化+纵波传播)。
  1. 启发:将声音分解成声带激励+声道调制。(分析发音内容时应更关注声道调制,分析情绪变化时应更关注声带激励的变化)
  2. 语音波形图(语音信号的时域表示)
  • 采样:如果在空间中确定一个位置,每隔一个非常短的时间(如1/16000秒)记录一次空气密度,即可记录下该点处的语音信号。
  • 采样点:每个记录值。
  • 采样频率:一秒内的采样次数(16000)。
  • 语音信号的波形图:将密度值表示为时间的函数。
    【注:空气密度变化和压力变化是一致的,因此语音波形记录的也是空气压力的变化】
  1. 语音频谱图(语音信号的频域表示)
  • 语音信号的短时平稳属性:从波形图可看出,在一较短时间内(如0.01秒)信号的特性变化很小,但长时间看,不同时段的信号特性会发生明显的变化。
  • 短时分析:将语音信号切分成一个个短时片段(信号稳定),利用各种稳态信号分析工具对这些片段进行处理。
  • 语音帧:这些短时语音片段,一般长度为0.01秒左右。
  • 短时频谱分析(一种常用的短时分析方法):提取每一帧中不同频率成分的能量大小。
  • 某帧的频谱/短时频谱:该语音帧在不同频率上的能量。
  • 某段语音的频谱:该段语音中的所有语音帧的短时频谱。
  • 频谱图:横轴:频率。
    [参考:https://www.cnblogs.com/tibetanmastiff/p/6741930.html]
  1. 语谱图:横轴:时间;纵轴:频率;颜色深浅:频率强度。
    [参考:https://www.cnblogs.com/tibetanmastiff/p/6741930.html]

二、语音的感知

  1. 计算机看到的语音:一维振动的采样序列。
  2. 语音信号中嵌入的信息:发音内容、说话人身份、说话方式、目标与动机等。
  3. 语音信号中的随机性:发音过程中的无意识变动(如送气和舌位差异)、外界环境的噪声、声音采集设备的差异等。

3.1 语音的产生与感知相关推荐

  1. 语音信号处理_书单 | 语音研究进阶指南

    作为人类最自然的交流方式,"听"和"说"包括了人类大脑皮层从听觉感知到语言处理和理解,再到声音生成这个"神奇"的认知过程.语音领域的探索和研 ...

  2. 打破传统降噪技术 看网易云信在语音降噪的实践应用

    导读:随着音视频会议.娱乐互动直播.在线教育产品的火热发展,产品中令人愉悦的音效音质体验是必不可少的. 文|飒飒 网易云信音视频算法工程师 但在音视频实时通信中,难免会遇到各种我们不希望出现的声音,例 ...

  3. 语音数字信号处理系统设计(含matlab程序)

    目录 1 概述 1.1.设计目的 1.2.设计要求 1.3.功能描述 1.3.1数字语音信号采集 1.3.2时域分析与频谱分析 1.3.3叠加噪声 1.3.4小波去噪 1.3.5数字滤波器处理 1.3 ...

  4. 视觉感知在数据可视化中的作用

    数据可视化的目标是让用户最真实.最高效的接收到界面所传达的信息内容.在过去很长的一段时间,数据可视化是将线下信息移至线上,形成简单数字化模型,达到高效.易懂的展示交互目标. 1.感知与可视化 高效的计 ...

  5. 与语音信号处理有关的java书籍_MATLAB在语音信号分析与合成中的应用 中文pdf扫描版[198MB]...

    语音信号处理是数字信号处理的一个重要分支.本书含有许多数字信号处理的方法和MATLAB函数.全书共10章.第1-4章介绍语音信号处理的一些基本分析方法和手段,以及相应的MATLAB函数:第5-9章介绍 ...

  6. 文献阅读----《病理语音的 S 变换特征及其提取方法》(笔记篇)

    一 概要 这是一篇论文阅读的笔记资料,欢迎提出意见.本文的介绍,不可能比原作者的话还要准确.到位,所以贴一下文章摘要: 病理语音具有强烈的非平稳性和突变性特点.S变换具有良好的时频分辨率和时频定位能力 ...

  7. 百度输入法每天语音被调度3.35亿次!它的成功可以复制?

    8月1日,百度发布了2018年二季度财报.财报显示,百度二季度营收260亿元人民币,同比增长32%,净利润64亿人民币,同比增长45%,移动端收入占比77%,高于去年同期的72%.当然,作为公司核心战 ...

  8. 西北工业大学计算机操作系统实验_西北工业大学语音关键词检出技术上线腾讯信息服务...

    通过产学研合作项目和腾讯犀牛鸟精英人才培养计划,西北工业大学计算机学院智能语音方向谢磊教授团队与腾讯合作的基于QBE的语音关键词检出技术近日成功上线腾讯信息服务.这也是继去年该团队语音识别后处理技术成 ...

  9. 毕业设计-基于深度学习的单通道语音降噪技术

    目录 前言 课题背景和意义 实现技术思路 一.基于子空间投影的时域语音降噪 二.基于噪声信息辅助的双阶段语音降噪 三.感知高相关时频损失函数研究 实现效果图样例 最后 前言

  10. 语音识别原理与应用 第三章 语音特征提取

    目录 第三章 语音特征提取 3.1预处理 3.2 短时傅立叶变换 3.3听觉特性 3.4线性预测 3.5倒谱分析 3.6常用的声学特征 第三章 语音特征提取 原始语音是不定长的时序信号,不适合直接作为 ...

最新文章

  1. PythonGUI开发:59行代码开发小型商店添加系统
  2. bat 执行 java jar包
  3. 9个妙招增强家庭WIFI信号
  4. 数据结构中三表合一的实现
  5. 腾讯再诉今日头条系 要求删除用户游戏视频
  6. CSS元素隐藏原理和效果小结
  7. EDI Party Resolution in Biztalk R2
  8. mybatis 注解的方式批量插入,更新数据
  9. 浅析JAVA设计模式之工厂模式(二)
  10. FTP服务器上传文件操作方法,FTP工具(FLASHFXP)下载使用教程
  11. 因果分析.科学实验评估
  12. cf. ConneR and the A.R.C. Markland-N
  13. mysql驱动有什么用_什么是数据库驱动?
  14. nexus9刷机全记录
  15. 高德地图API调用和数据解析
  16. log4j自定义新的级别
  17. python中的可迭代是什么意思_Python可迭代跟迭代器的区别
  18. linux下eclipse的使用,linux下使用eclipse
  19. c++学习笔记-二进制文件操作(哔站-黑马程序员c++教学视频)
  20. 让复选框实现单选功能

热门文章

  1. Spring源码之动态AOP自定义标签
  2. 【渝粤教育】国家开放大学2018年春季 0175-22T社会调查研究与方法 参考试题
  3. [渝粤教育] 西南科技大学 西方现代派文学 在线考试复习资料
  4. 线性模型第4讲:弹性网络
  5. pku2406 Power Strings(kmp字符匹配,next数组)
  6. 23种设计模式(十九)数据结构之组合模式
  7. 斑斓中国BlenderCN项目库
  8. Yii2.0 两次奇葩的数据库连接经历
  9. Rabbit MQ 安装
  10. 学习python3(一)