声明:工作以来主要从事TTS工作,平时看些文章做些笔记。文章中难免存在错误的地方,还望大家海涵。平时搜集一些资料,方便查阅学习:TTS 论文列表 http://yqli.tech/page/tts_paper.html TTS 开源数据 http://yqli.tech/page/data.html。如转载,请标明出处。欢迎关注微信公众号:低调奋进

我感觉一个领域的成熟标志就是综述文章的出现,从4月份到现在已经有三篇高质量的综述文章发出,本文主要向读者推荐该三篇文章。虽然我已经阅读了这三篇文章,但我不想直接翻译出来。读者想学习更多的知识,需要自己通读一遍。(综述的文章都很简单,阅读综述文章其实是一种享受).


1Review of end-to-end speech synthesis technology based on deep learning

西安交通大学在4月份更新的文章

2 A Survey on Neural Speech Synthesis

亚洲微软在6月份更新的文章

3 A Survey on Audio Synthesis and Audio-Visual Multimodal Processing

中国电子科技大学在8月份更新的文章


Review of end-to-end speech synthesis technology based on deep learning

该篇文章主要介绍基于神经网络的语音合成技术,也就是近五年来的发展状况。该篇文章的重点在声学模型和声码器的介绍已经优缺点,当然也简单总结了可用的数据集。

A Survey on Neural Speech Synthesis

重点向大家推荐这篇谭旭撰写的这篇文章。该篇文章的组织架构更加清晰简洁而且更加全面。该文章从多个角度进行分类归纳,首先从TTS的每个组成部分进行归纳,然后对TTS前沿话题进行归纳。

图三展示的是按照TTS组成进行划分,图6对模型的进化史进行全面展示,这个张图还是挺有意思。最后的图7总结了TTS的前沿话题。最后,本文对TTS的从代码库和数据也进行总结。

我的文章分类其实跟谭旭这篇文章类似,大家想一直跟踪行业文章发表情况可以收藏我的网站http://yqli.tech/page/tts_paper.html

A Survey on Audio Synthesis and Audio-Visual Multimodal Processing

该篇文章总结的范围更加广泛,包括语音合成,音乐生成和音视频多模态等等。虽然该篇文章没有上边谭旭文章的详细,但对多个领域进行整理。

语音合成论文优选:语音合成综述(2021)相关推荐

  1. 语音合成论文优选:M2voc大赛总结The M2voc Challenge 2021

    声明:语音合成论文优选系列主要分享论文,分享论文不做直接翻译,所写的内容主要是我对论文内容的概括和个人看法.如有转载,请标注来源. 欢迎关注微信公众号:低调奋进 The Multi-speaker M ...

  2. 语音合成论文优选:Flavored Tacotron: Conditional Learning for Prosodic-linguistic Features

    声明:语音合成论文优选系列主要分享论文,分享论文不做直接翻译,所写的内容主要是我对论文内容的概括和个人看法.如有转载,请标注来源. 欢迎关注微信公众号:低调奋进 Flavored Tacotron: ...

  3. 语音合成论文优选:唇语Speaker disentanglement in video-to-speech conversion

    声明:语音合成论文优选系列主要分享论文,分享论文不做直接翻译,所写的内容主要是我对论文内容的概括和个人看法.如有转载,请标注来源. 欢迎关注微信公众号:低调奋进 Speaker disentangle ...

  4. 语音合成论文优选:Unified Mandarin TTS Front-end Based on Distilled BERT Model

    声明:语音合成论文优选系列主要分享论文,分享论文不做直接翻译,所写的内容主要是我对论文内容的概括和个人看法.如有转载,请标注来源. 欢迎关注微信公众号:低调奋进 Unified Mandarin TT ...

  5. 语音合成论文优选:Efficiently Trainable Text-to-Speech System Based on Deep Convolutional Networks with Guide

    声明:语音合成论文优选系列主要分享论文,分享论文不做直接翻译,所写的内容主要是我对论文内容的概括和个人看法.如有转载,请标注来源. 欢迎关注微信公众号:低调奋进 Efficiently Trainab ...

  6. 语音合成论文优选:音素韵律控制Prosodic Clustering for Phoneme-level Prosody Control in End-to-End Speech Synthesis

    声明:平时看些文章做些笔记分享出来,文章中难免存在错误的地方,还望大家海涵.搜集一些资料,方便查阅学习:http://yqli.tech/page/speech.html.语音合成领域论文列表请访问h ...

  7. 语音合成(TTS)论文优选:Accent and Speaker Disentanglement in Many-to-many Voice Conversion

    声明:语音合成(TTS)论文优选系列主要分享论文,分享论文不做直接翻译,所写的内容主要是我对论文内容的概括和个人看法.如有转载,请标注来源. 欢迎关注微信公众号:低调奋进 Accent and Spe ...

  8. 语音合成(TTS)论文优选:End-to-End Code-Switching TTS with Cross-Lingual Language  Model

    声明:语音合成(TTS)论文优选系列主要分享论文,分享论文不做直接翻译,所写的内容主要是我对论文内容的概括和个人看法.如有转载,请标注来源. 欢迎关注微信公众号:低调奋进 End-to-End Cod ...

  9. 语音合成TTS论文优选:A HYBRID TEXT NORMALIZATION SYSTEM USING MULTI-HEAD SELF-ATTENTION FOR MANDARIN

    声明:语音合成(TTS)论文优选系列主要分享论文,分享论文不做直接翻译,所写的内容主要是我对论文内容的概括和个人看法.如有转载,请标注来源. 欢迎关注微信公众号:低调奋进 A HYBRID TEXT ...

最新文章

  1. 为什么可以说Java语言是准动态语言?
  2. 零基础python入门书籍推荐书目_铁粉看过来!送书啦,Python推荐书单,送书10本!...
  3. sql 跟踪工具sql profiler使用
  4. 灯光插件_Light Kit Pro 3灯光插件
  5. concat函數 函數concat 可以用來合拼兩個或以上的字串。
  6. iOS 开发-文件下载原理
  7. Java案例:接口的静态方法
  8. ROS学习笔记六:理解ROS服务和参数
  9. 【李宏毅2020 ML/DL】P20-21 Recurrent Neural Network | “Deep and structure is future.“
  10. 使用HALCON进行图像分类——图像分类(系统讲解,附模板例程精讲)
  11. 哈夫曼编码(Huffman Coding)原理详解
  12. 三栏式布局的几种实现方式
  13. php get month,JavaScript从Date对象返回月份 (0 ~ 11)的方法getMonth()
  14. 浅谈 Kafka Leader Epoch
  15. java itext5 插入一个艺术文字 (剪切蒙版)
  16. 麒麟座迷你板STLINK使用
  17. .NET网页显示饼形图
  18. Vim常用操作,normal模式、insert模式和visual模式
  19. Markdowm编辑器推荐和Emoji 表情
  20. 时光机与流浪者-我的2017

热门文章

  1. 拼多多猛击阿里,极兔狠怼三通一达,段永平要挑战马云?
  2. 塞尔维亚国家队大名单:马蒂奇领衔,古德利落选
  3. 【已兑完】书单 | 2019开年福利 —— 你学专栏,我送书!
  4. 2017年上半年信息安全工程师上午选择题及解析
  5. 胡乱折腾之后,你的脸蛋憔悴了几分?
  6. centos编译Aegisub
  7. dhu复试基础——63 倒序
  8. 使用新浪微博API的OAuth认证发布微博
  9. AirPods过河,苹果拆桥:被“钞能力”征服的Beats何以至此?
  10. 图片路径前缀有blob?图片渲染不出来?