统计参数语音合成中的声学模型建模方法研究
阅读中科大雷鸣2012年博士毕业论文后整理个人读书笔记
1. 绪论
传统语音合成的方法
- 基于HMM的统计参数语音合成(也是本文要讲的重点,参数统计的办法)
- 基于大量语料的单元挑选与波形拼接
一般的语音合成系统可以分成(1)前端文本–文本转成层次化的语音学表示;(2)后端语音合成–从层次化的语音学表示合成语音,其中韵律特征预测可以和语音合成作为一个整体,也可以单独拉出来作为一个模块。
人类发生系统可以发出三类语音:
(1)浊音:(比如元音)肺部气压升高,强迫空气通过声门,使声带振动产生的类周期性宽频脉冲
(2)摩擦音:(比如辅音,/s/, /sh/, /f/)空气以足够的速度通过部分关闭的声门
(3)爆破音:(比如/p/, /t/,/k/)空气在完全闭合的声道累积增压,然后突然打开声道产生的。
1.3 语音合成方法的分类
1.3.1 基于规则的参数化语音合成
—每一个音段的合成参数需要根据上下文情况结合规则进行一定的设定,合成器根据设定好的语音参数进行合成
- 物理机理语音合成
例如VODER(语音合成器),由宽带噪声源和周期振荡器组成两个声源,还有多个带通滤波器模拟声道。还有一种是对声带和发声器官在发音过程中的变化进行3D建模。
但是这类方法模拟的对象非常复杂,很难精确度量变化。 - source-filter合成
其中基于source-filter合成的有两种方法,两者原理类似,但是声道模型不同
(1)线性预测分析合成
其中,aia_iai是线性预测系数,用最小均方误差,Levinson-Durbin等算法估计线性预测系数。
(2)共振峰合成器—它的设计考虑了人的发声机理,声道模型堪称一个谐振腔,声道特性由谐振腔的谐振频率,也就是共振峰表示。共振峰合成可以根据发生机理模拟各种声学特征,但它的结构比较复杂,实际实现的效果并不好。
1.3.2 基于波形拼接的语音合成
方法: 根据输入文本分析后的信息,从指定的音库中挑选合适的信息,进行必要的调整之后,合成最终的语音。由于最终的语音的基本单元都是从音库中直接挑选出来的,因此保持了原始发音人的音质。
评价:该方法会受到音库大小和单元挑选算法的影响,但是随着计算机运算和存储能力的提升,上述的限制已经不大。但是需要大的语料库,成本昂贵。
1.3.3 基于统计建模的参数化语音合成
方法:对输入的语音进行参数化表征,然后进行声学参数建模,并以训练得到的模型为基础构建合成系统。是自动构架的合成系统。
2. 基于HMM的统计参数语音合成
2.1 HMM简介
- 一阶马尔可夫链:序列中任意时刻的变量仅和它前一时刻变量的分布有关,与更前的时刻无关。
因此,根据贝叶斯定理,随机变量的联合分布可以写成条件分布的连乘积:
在一阶马尔可夫的假设下,随机变量的分布可以简化为
- M阶马尔可夫链:序列中任意时刻的变量仅和它前M个时刻变量的分布有关,与更前的时刻无关。
统计参数语音合成中的声学模型建模方法研究相关推荐
- lammps和atomsk中常用的建模方法
文章目录 1.Atomsk生成刃型位错 2.Atomsk生成任意角度晶界 3.Atomsk生成孪晶 4.Atomsk生成非晶 5.合金多晶结构建模 6.Atomsk建立管道类模型 7.Atomsk建立 ...
- 人脸扫描建模_人脸识别中的特征建模方法与流程
本发明涉及生物特征识别,特别是涉及人脸识别中的特征建模方法. 背景技术: 人脸识别技术一般包括四个组成部分,分别为人脸图像采集.人脸图像预处理.人脸图像特征提取以及匹配与识别,具体来说: 人脸图像采集 ...
- 模块化多电平换流器matlab建模,模块化多电平换流器电磁暂态高效建模方法研究...
模块化多电平换流器高压直流输电(Modular Multilevel Converter based High Voltage Direct Current, MMC-HVDC)以其独特的技术优势,已 ...
- Oracle Spatial中上载GIS空间数据方法研究
Oracle Spatial中上载GIS空间数据方法研究 作者:佚名 文章来源:博客中国 点击数:6873 更新时间:2006-8-24 摘要:采用Oracle Spatial 存储 ...
- 统计计量 | 统计学中常用的数据分析方法汇总
来源:数据Seminar本文约10500字,建议阅读15+分钟 统计学中常用的数据分析方法汇总. Part1描述统计 描述统计是通过图表或数学方法,对数据资料进行整理.分析,并对数据的分布状态.数字特 ...
- 常见的目标检测中的背景建模方法总结
最近一直在做前景检测方面的研究,刚开始主要是做一些工程性的应用,为了解决工程方面的问题,下了不少功夫,也看了不少最近国内外的文章.一直想做个总结,拖着拖着,终究却写成这篇极不成功的总结.(文章下载:h ...
- 常见的目标检测中的背景建模方法
Author: JW. ZHOU 2014/6/13 最近一直在做前景检测方面的研究,刚开始主要是做一些工程性的应用,为了解决工程方面的问题,下了不少功夫,也看了不少最近国内外的文章.一直想做个总结, ...
- Background Subtraction and Modeling 常见的目标检测中的背景建模方法漫谈
转载者的话: 最近一直在看background subtraction and modeling.正如如下链接的第一个回帖所说,背景建模虽然最近研究不是很热,但对视频的处理至关重要,甚至直接影响一个系 ...
- 浅谈数据仓库建设中的数据建模方法
http://www.ibm.com/developerworks/cn/data/library/techarticles/dm-0803zhousb/ 所谓水无定势,兵无常法.不同的行业,有不同行 ...
最新文章
- windows10删除更新的程序
- 线程池之SingleThreadPool学习
- python人工智能-Python 人工智能应用快速入门 (一)
- python3官方最新下载-Python3.9下载
- Laravel 数据库实例教程 —— 使用DB门面操作数据库
- 灵魂拷问!软件架构师书籍
- opencv源码解析之(5):CommandLineParser类的简单理解
- 万维钢 万万没想到读书笔记
- hp 126NW驱动安装
- sql-in查询-元素超过1000条解决方案
- 正则表达式中常用符号
- 贝叶斯法则与先验后验概率以及似然度的关系
- 机器视觉之工业摄像机知识点(二)
- ASPX页生成静态HTML页(五种方案)
- 深度学习可解释性研究(二): Understanding Black-box Predictions via Influence Functions(详细公式推导)
- 【对话生成】常见对话生成数据集整理,含下载链接(更新至2022.06.04)
- 服务器系统安装优盘启动工具,u盘启动大师在Win10上安装和卸载远程服务器管理工具的方法...
- 2021年G2电站锅炉司炉考试试卷及G2电站锅炉司炉证考试
- 量化投资认知--听课笔记
- Android 四大组件通信核心
热门文章
- 抖音用什么编程语言_抖音app开发者的心路历程:论开发者的一些经验之谈
- 前端裁图-如何使用ps软件将矩形图片裁剪成圆角矩形
- C语言报错警告合集(转)
- 什么是TMD格式?TDM格式详细介绍
- 浙大计算机学硕初试分数线,2016年浙江大学计算机考研复试分数线_浙江大学考研分数线...
- maven失败测试用例rerun插件使用方法
- OHS简单安装与系统配置
- windows安装OHS(weblogic管理)
- iOS https 自制证书 单向 双向 验证,以及服务器(Nginx)配置
- 算法 c语言实现 英文版 pdf,数据结构与算法分析++C语言描述++英文版++..pdf-得力文库...