声明:语音合成(TTS)论文优选系列主要分享论文,分享论文不做直接翻译,所写的内容主要是我对论文内容的概括和个人看法。如有转载,请标注来源。

欢迎关注微信公众号:低调奋进

ByteSing: A Chinese Singing Voice Synthesis System Using Duration Allocated Encoder-Decoder Acoustic Models and WaveRNN Vocoders

本篇文章是总部ai实验室在2020.04.23更新的文章,主要做音乐合成,具体的文章链接https://arxiv.org/pdf/2004.11012.pdf 该文章的demo

https://bytesings.github.io/paper1.html (听起来还不错)

1 背景

音乐合成是根据语言特征和音乐特征合成歌曲,歌唱合唱技术是人机交互的各种应用程序中不可缺少的基本组件,例如虚拟化身,语音助手和智能电子设备等等。同时,歌唱合成系统可以与其他生成任务(如自动歌词和旋律生成)结合使用。多模式技术,歌唱合成和乐曲合成的组合越来越受欢迎。因此,对高保真,高自然度,更准确的歌唱算法的期望在将来会越来越高。本文提出基于类似tacotron +wavernn方案的歌唱合唱方案ByteSing,效果还算不错。

2 详细系统设计

图一展示了bytesing 系统的整体架构,该系统包含时长模型,声学模型和神经网络声码器。时长模型的输入为音素+音素类型+节奏和音符时长,输出为音素对应的时长。声学模型的输入为音素+音符音高+每帧的位置信息,输出为声学信息,具体为图2展示。看到图2结构可能大家跟我有相同的疑惑,既然时长模型已经预测出了每个音素时长,为什么还使用attention?本文在实验部分给出了实验结果:使用attention的效果更好。神经网络声码器是把声学特征转成波形,具体结构图3所示。

3 实验

本文实验对比一下几个方面:Natural是原始录音,ByteSing为本文提出方案,BS-w/o-attention为不使用attention方案,BS-w-To为输入特征添加音调信息。

客观指标如table 2显示,本文ByteSing在各项指标最好,说明使用attention效果提升,同时添加音调信息结果反而不好。图4是attention的对齐信息。图5展示了主观MOS评测,该部分说明ByteSing在pitch, rhythm,pron,breath和express等方面跟原始录音差别不大。

4 总结

歌唱合唱技术是人机交互的各种应用程序中不可缺少的基本组件,例如虚拟化身,语音助手和智能电子设备等等。本文提出基于类似tacotron +wavernn方案的歌唱合唱方案ByteSing,效果还算不错

语音合成(TTS)论文优选:ByteSing: A Chinese Singing Voice Synthesis System Using Duration Allocated Encoder-De相关推荐

  1. 语音合成TTS论文优选:A HYBRID TEXT NORMALIZATION SYSTEM USING MULTI-HEAD SELF-ATTENTION FOR MANDARIN

    声明:语音合成(TTS)论文优选系列主要分享论文,分享论文不做直接翻译,所写的内容主要是我对论文内容的概括和个人看法.如有转载,请标注来源. 欢迎关注微信公众号:低调奋进 A HYBRID TEXT ...

  2. FAST AND HIGH-QUALITY SINGING VOICE SYNTHESIS SYSTEM BASED ON CONVOLUTIONAL NEURAL NETWORKS

    摘要 本文介绍了基于卷积神经网络(CNN)的歌声合成.当前提出的基于深度神经网络(DNN)的唱歌声音合成系统,并且改善合成唱歌声音的自然性.由于歌声代表着丰富的表达形式,因此需要一种强大的技术来准确地 ...

  3. 语音合成(speech synthesis)方向六:歌唱合成(singing voice synthesis)

    声明:工作以来主要从事TTS工作,工程算法都有涉及,平时看些文章做些笔记.文章中难免存在错误的地方,还望大家海涵.平时搜集一些资料,方便查阅学习:TTS 论文列表 低调奋进 TTS 开源数据 低调奋进 ...

  4. 语音合成(TTS)论文优选:Accent and Speaker Disentanglement in Many-to-many Voice Conversion

    声明:语音合成(TTS)论文优选系列主要分享论文,分享论文不做直接翻译,所写的内容主要是我对论文内容的概括和个人看法.如有转载,请标注来源. 欢迎关注微信公众号:低调奋进 Accent and Spe ...

  5. 语音合成(TTS)论文优选:End-to-End Code-Switching TTS with Cross-Lingual Language  Model

    声明:语音合成(TTS)论文优选系列主要分享论文,分享论文不做直接翻译,所写的内容主要是我对论文内容的概括和个人看法.如有转载,请标注来源. 欢迎关注微信公众号:低调奋进 End-to-End Cod ...

  6. 语音合成(TTS)论文优选:Location-Relative Attention Mechanisms for Robust Long-Form Speech Synthesis

    声明:语音合成(TTS)论文优选系列主要分享论文,分享论文不做直接翻译,所写的内容主要是我对论文内容的概括和个人看法.如有转载,请标注来源. 欢迎关注微信公众号:低调奋进 Location-Relat ...

  7. 语音合成(TTS论文优选:VocGAN: A High-Fidelity Real-time Vocoder with a Hierarchically-nested Adversarial Netw

    声明:语音合成(TTS)论文优选系列主要分享论文,分享论文不做直接翻译,所写的内容主要是我对论文内容的概括和个人看法.如有转载,请标注来源. 欢迎关注微信公众号:低调奋进 VocGAN: A High ...

  8. 《Exploring Cross-lingual Singing Voice Synthesis Using Speech Data》论文阅读

    任务 歌唱合成的目的是给定乐谱和旋律, 合成歌唱音频.歌唱合成系统能够通过训练目标说话人相关的同一语言下的歌唱/语音数据来构建. 目前大多数的歌唱合成系统只支持一种语言,给定说话人的语音数据(同一语言 ...

  9. 歌声合成 (Singing Voice Synthesis)理论

    歌声合成原理 歌唱产生的音乐成为歌声.歌唱更注意着重于通过横膈膜和腹部甚至下腹部肌肉来调整呼吸, 从而更好地控制音高.音色等. 歌唱中的颤音是指音高急剧上下波动的声音,是由空气有控制地通 过放松的喉部 ...

最新文章

  1. 细化 Sobel 边缘提取
  2. 【Linux 内核】CFS 调度器 ⑥ ( CFS 调度器就绪队列 cfs_rq | Linux 内核调度实体 sched_entity | “ 红黑树 “ 数据结构 rb_root_cached )
  3. TCP/IP / TCP 头
  4. 2021年高考成绩查询陕西文科,2021年陕西高考文科二本分数线预测
  5. 洪磊父亲避谈洪磊获释 拘留已过24小时留滞期
  6. mac securecrt程序无响应_Adobe庆祝Photoshop问世30周年 为Mac和iPad版本提供新功能
  7. 基于summernote的富文本编辑器,粘贴时去除word、html格式
  8. Luogu3516 POI2011 Shift 构造
  9. python多线程queue_python多线程+队列(提高爬虫时效性)
  10. java并发编程实战读书笔记 ExecutorCompletionService
  11. 合成PDF(多文件变一文件、多页变一页)
  12. 开发者选项看html,手机怎么打开开发者选项?开发者模式开启方法
  13. 巧用CHKDSK命令修复U盘文件或目录损坏问题
  14. android root查看目录权限,Android真机获取root权限,进入data目录
  15. 跨境电商虾皮值不值得做?你了解多少
  16. 计算机文化考试论文,计算机文化基础论文
  17. 不礼让行人怎么抓拍的_注意啦!电子警察如何抓拍不礼让行人?所有司机都要看看...
  18. android_54a3,碉堡了,连神画Y1投影仪都可以跑android大型游戏N.0.V.A3
  19. matlab adaptfilt.rls,基于RLS算法的多麦克风降噪
  20. mysql安装 张宴_Linux_centos5 源码安装Nginx + mysql + apache + php的方法,主要依照的是张宴的一篇博文 - phpStudy...

热门文章

  1. Matlab光标在线上移动,vi光标移动及常用指令
  2. 如何用Redis实现分布式锁?
  3. 【Unity】面试题
  4. 前端网页技术之 Vue
  5. 在c语言中,字符串topt65的长度是,c语言程序设计期末考试试题(含答案)123612210...
  6. 解决梯度爆炸和梯度消失
  7. 如何解决数据库统计时的会计年度和会计月份问题
  8. 服务器主板开机显示器无信号,显示器无信号,详细教您怎么解决电脑开机后显示器无信号...
  9. 求生之路2怎么联机显示服务器,求生之路2联机如何创建服务器?
  10. iPhone Web App 导航设计探讨