韵律简介
语音合成任务流程

语音合成合成器生成语音波形,其过程如下:
①文本分析处理,即按照语义、语法等规则对文本进行分词和标注,将文本序列转换成字的音节序列。
②根据语境、韵律规则和韵律模型,为每个音节或词组调整韵律参数,将音节序列转换成音韵序列。
③运用语音合成技术,按要求合成出高质量的语音流。

韵律概念

■ 韵律是语言交际的重要元素,是一种听觉和感知相结合的概念,它能帮助听者理解说话者要表达出来的信息。

■ 自然语句中的韵律特征包括语调、节奏和重音等,人们使用它们能表达出情感和意向。

■ 现如今语音合成的自然度依旧不是那么的理想,其根本问题就是对自然语句中的韵律不能有效的模拟。

韵律层级


韵律短语切分方法

韵律短语切分任务

①语音合成系统想取得高质量的语音,就必须具备韵律标注处理的功能。

②韵律短语切分精度直接影响到语音合成的质量,该工作通常需要专业标注人员进行标注。

③随着目前语料库的加大,人工进行韵律边界的标注成本较大,而且人工标注存在一定主观性。因此如何精确自动地对韵律边界标注己经成为目前一个急需解决的问题。

韵律短语自动切分的意义

经过自动切分预处理数据,可节省人工标注时间;提高预识别的准确率和覆盖率即可提高生产效率,减少人工成本。

韵律短语切分方法综述

基于规则方法

■ 基于语法短语结构的自动语法分析器

曹建芬学者提出的基于语法信息的韵律结构预测方法的研究对汉语韵律短语的预测产生了很大的影响。

流程:
①对系统的输入文本进行分词和词性标注;
②利用第一步得到的分词信息,对输入文本进行韵律组词;
③对输入文本进行句法的切分以及标注;
④搭建韵律结构预测树;
⑤确定韵律边界的位置并计算该位置与上一个韵律边界的距离大小;
⑥输出语句的韵律结构。

基于统计方法

■ 非确定性的定量推理方法,把文本中的每一个词、短语以及切分点的出现都看作是一个随机过程。

大量的统计模型已经被应用于汉语韵律短语边界预测中,其中最常见的机器学习模型有决策树模型、转换规则学习以及隐马尔可夫模型等方法。
其基本流程:
①通过考察边界的上下文词类组合,找到确定分界点的规律。
②经过韵律短语切分标注的一批语料中统计得到相应停顿点的上下文信息。
③然后依据短语分界点统计信息在词性序列中预测短语切分点,实现韵律短语的自动切分。

基于深度神经网络方法

■ 词向量与深度神经网络相结合,使模型在输入特征和模型结构上都有效地避免了模型的局限性

在自然语言处理领域尤其是韵律层级预测方面,将词用“词向量”来表示,用深度神经网络来捕捉多层级间的信息是将深度学习算法引入韵律结构预测领域的核必技术,是现阶段业界研究的重要方向。

三种方法对比

基于BILSTM模型的切分方法

韵律短语切分实验-流程简图

韵律短语切分实验 - 标注序列 BEMS

韵律分词的第一步便是标注字,字标注是通过给少量人工标注切分好的句子中每个字打上标签,通过4标签来进行标注(single,单字成词;begin,多字词的开头;middle,三字以上词语的中间部分;end,多字词的结尾。均只取第一个字母。),这样,“为人民服务”就可以标注为“sbebe”了。4标注不是唯一的标注方式,类似地还有6标注,理论上来说,标注越多会越精细,理论上来说效果也越好,但标注太多也可能存在样本不足的问题,一般常用的就是4标注和6标注。


韵律短语切分实验-流程简图

韵律短语切分实验 - 训练网络

如下图所示,神经网络的模块A正在读取某个输入 xi,并输出一个值 hi。循环路径可以使得信息可以从当前步传递到下一步。
RNN 可以被看做是同一神经网络的多次赋值,每个神经网络模块会把消息传递给下一个。所以将这个循环展开,链式的特征揭示了 RNN 本质上是与序列和列表相关的。


韵律短语切分实验 – LSTM模型

LSTM模型 – 遗忘门

LSTM模型 – 更新门(1)

LSTM模型 – 更新门(2)

LSTM模型 – 输出门


韵律短语切分实验 - BILSTM结构

LSTM对句子进行建模还存在一个问题:无法编码从后到前的信息。

举一个例子,“这个餐厅脏得不行,没有隔壁好”,这里的“不行”是对“脏”的程度的一种修饰,通过BiLSTM可以更好的捕捉双向的语义依赖。


韵律短语切分实验-流程简图


韵律短语切分实验 - Viterbi算法

维特比算法是一个特殊但应用最广的动态规划算法,利用动态规划,可以解决任何一个图中的最短路径问题。

通过已知的可以观察到的序列,和一些已知的状态转换之间的概率情况,通过综合状态之间的转移概率和前一个状态的情况计算出概率较大的状态转换路径,从而推断出隐含状态的序列的情况。

维特比算法的精髓就是,既然知道到第i列所有节点Xi{j=123…}的最短路径,那么到第i+1列节点的最短路径就等于到第i列j个节点的最短路径+第i列j个节点到第i+1列各个节点的距离的最小值。


韵律短语切分实验 - 程序主要代码


韵律短语切分实验-流程简图


韵律短语切分实验 - 自动切分后结果

实验结果及对比

采用数据堂标注部门验收通过的79703 条中文韵律已标注数据作为本次实验数据,取其中95%作为训练集,5%作为测试集,采用基于LSTM循环神经网络来训练韵律层级标注模型进行实验,结果如下表所示:

从实验结果可以看出,
■ 模型预测正确率为92.15%左右
■ 模型预测召回率为82.42%左右
■ 模型预测句对率为61%左右
■ 实验结果显示此方法对韵律短语切分效果优于基于边界点词性特征统计的韵律短语切分方法

韵律短语切分实验 - 效果反馈

由生产部门反馈结果不难发现,本次实验在一定程度上实现了韵律短语切分的目的,生产效率提高了2.5倍。后期针对处理分词中的缺陷不足可进行进一步优化。

总结与展望

总结
■ 利用深度神经网络学习词向量,将韵律词及标签向量作为输入特征,通过对模型的输入特征和模型结构进行改进,使模型有效的规避了隐马尔可夫模型、决策树模型、最大熵模型等模型的局限性,在输入特征中加入韵律词向量,对韵律短语预测精度提高起到了积极的作用。

不足
■ 短语边界标注时并未考虑语法词性成分
■ BiLSTM模型弊端

展望
■ 短语边界标注时充分考虑语法词性成分,可以借鉴语法分析器方法
■ 模型中引入Attention机制

参考文献
[1] 汉语的韵律词与韵律短语.王洪君.2003
[2] 基于深度神经网络的韵律结构预测研究.王琦.2017
[3] 提高韵律短语正确切分方法的研究.吴晓慧.2014
[4] 基于半监督学习的汉语韵律短语预测研究.苏丹.2015
[5] 基于静音时长和文本特征融合的韵律边界自动标注.傅睿博.2018

汉语韵律短语切分方法初探相关推荐

  1. 什么是韵律词、韵律短语、语调短语?

    韵律词 的概念与分词类似. 韵律短语 包含韵律词,一般由韵律词和语气词组成. 语调短语 包含韵律短语,一般指一个大停顿. 摘要  语句和篇章的韵律结构和信息结构的分析以及其模型化, 是提高 语音合成自 ...

  2. 语法词、韵律词、韵律短语、语调短语

    一.何谓词汇词和语法词 词汇词指的是根据词的同一性原则经过抽象.概括.归纳划分出来的能独立运用的最小音义结合体.语法次指的是词汇词在一定语法框架中词性的实现,这种实现了词类可能性的词才是语法词. 如& ...

  3. 特征图注意力_从数据结构到算法:图网络方法初探

    作者 | 朱梓豪 来源 | 机器之心 原文 | 从数据结构到算法:图网络方法初探 如果说 2019 年机器学习领域什么方向最火,那么必然有图神经网络的一席之地.其实早在很多年前,图神经网络就以图嵌入. ...

  4. 基于遗传算法的大规模工程优化设计方法初探

    第七章 基于遗传算法的大规模工程优化设计方法初探 §7.1 概述 前面的章节对单目标遗传算法作了较深入的研究,并作了一些改进,提出了摄动单目标遗传算法,并做了将一般的传统的优化算法(包括改进的MDOD ...

  5. 快速提取过火区域,卫星影像评估西昌山火方法初探

    快速提取过火区域,卫星影像评估西昌山火方法初探 转自易智瑞中国 2020年3月30日15时,四川凉山州西昌市突发森林火灾,火势迅速蔓延,危及西昌市区.截至3月31日16时,火灾过火面积1000余公顷, ...

  6. 公开学术报告笔记 | 上海雷达同心学术论坛之雷达图像解译技术研讨会-合成孔径雷达学习成像方法初探

    笔记原文链接:https://mp.weixin.qq.com/s/Cp5NhUhPZ91CmoeK-WytmQ ↑ \uparrow ↑ 打开上述链接即可阅读全文 讲座信息: 报告人:武俊杰教授, ...

  7. GIS遥感科技论文写作技巧与方法初探-张杰-专题视频课程

    GIS遥感科技论文写作技巧与方法初探-90人已学习 课程介绍         课程分层次讲述了GIS遥感科技论文写作中涵盖的各个方面,从期刊介绍.论文结构.文献管理到附图绘制和空间分析方法及夜间灯光数 ...

  8. 经验分享:心田花开一年级汉语音标口诀记忆方法 速藏

    心田花开整理了一年级汉语音标口诀记忆方法,希望对一年级的小朋友有所帮助. 元音部分: 1).单元音: [i:].[i].[:].[u:].[u].[:].[ɑ:].[e] 2).双元音: [ei].[ ...

  9. 山体计算机科学与技术,三维山体建模方法初探

    论文导读:随着信息技术的逐步发展和社会要求的逐步提高,虚拟现实的研究领域开始转向山体.水域等不规则形态的实体.本文以山体为例就不规则形体的可视化过程进行研究,探讨一种不需要实体数据,计算机可视化技术与 ...

最新文章

  1. python file_python3之File文件方法
  2. 【收藏】GeoMesa Spark
  3. leetcode 移动零
  4. Redis经典面试题
  5. C语言的printf一些骚操作
  6. 盘点过去10年美国规模最大科技公司IPO:阿里一直是纪录保持者
  7. QuarkXPress 2022 for mac(排版设计软件)
  8. 电机不动 米兔机器人_深度解密米兔积木机器人八大黑科技
  9. android画图 旋转 地球*月球,unity3d怎么实现地球太阳月球转动-unity3d实现地球太阳月球转动的方法 - 河东软件园...
  10. 扫描机一直显示连接服务器,扫描仪通过SMTP中继服务器发送通知邮件失败
  11. 技术团队如何高效开会
  12. 计算机桌面图标变大怎么解决,小编教你电脑桌面图标变大了怎么办
  13. 【矩阵计算GPU加速】numpy 矩阵计算利用GPU加速,cupy包
  14. 用HTML+CSS做一个漂亮简单的节日网页【元宵节】
  15. JavaScript面试题111-120
  16. 大学小说男主计算机,一部小说,男女主是大学校友,男主比较高冷,一次聚会上认识,男主对女主一见钟情,然后带去出租屋里睡了...
  17. 【Mac】如何显示文件夹内隐藏文件
  18. 人性21——离奇自杀案
  19. (精华2020年6月2日更新) TypeScript的数据类型
  20. 给expvarmon插上数据持久化的“翅膀”

热门文章

  1. 运维人员必备的Linux系统命令汇总
  2. 【android】android真机测试方法
  3. 提取视频关键帧和关键帧的时间点信息
  4. Vue-2-表单、组件
  5. 专注年轻一代,基于E-MapReduce梨视频推荐系统
  6. 外卖O2O硝烟初起 巨头们各自是啥思路?
  7. Yapi环境搭建(史上最详细步骤)
  8. 55.【Java 线程】
  9. 运动搜索算法之钻石搜索
  10. 克服“测试怠惰”的习惯