声明：工作以来主要从事TTS工作，平时看些文章做些笔记。文章中难免存在错误的地方，还望大家海涵。平时搜集一些资料，方便查阅学习：TTS 论文列表 http://yqli.tech/page/tts_paper.html TTS 开源数据 http://yqli.tech/page/data.html。如转载，请标明出处。欢迎关注微信公众号：低调奋进

我感觉一个领域的成熟标志就是综述文章的出现，从4月份到现在已经有三篇高质量的综述文章发出，本文主要向读者推荐该三篇文章。虽然我已经阅读了这三篇文章，但我不想直接翻译出来。读者想学习更多的知识，需要自己通读一遍。（综述的文章都很简单，阅读综述文章其实是一种享受）.

1Review of end-to-end speech synthesis technology based on deep learning

西安交通大学在4月份更新的文章

2 A Survey on Neural Speech Synthesis

亚洲微软在6月份更新的文章

3 A Survey on Audio Synthesis and Audio-Visual Multimodal Processing

中国电子科技大学在8月份更新的文章

Review of end-to-end speech synthesis technology based on deep learning

该篇文章主要介绍基于神经网络的语音合成技术，也就是近五年来的发展状况。该篇文章的重点在声学模型和声码器的介绍已经优缺点，当然也简单总结了可用的数据集。

A Survey on Neural Speech Synthesis

重点向大家推荐这篇谭旭撰写的这篇文章。该篇文章的组织架构更加清晰简洁而且更加全面。该文章从多个角度进行分类归纳，首先从TTS的每个组成部分进行归纳，然后对TTS前沿话题进行归纳。

图三展示的是按照TTS组成进行划分，图6对模型的进化史进行全面展示，这个张图还是挺有意思。最后的图7总结了TTS的前沿话题。最后，本文对TTS的从代码库和数据也进行总结。

我的文章分类其实跟谭旭这篇文章类似，大家想一直跟踪行业文章发表情况可以收藏我的网站http://yqli.tech/page/tts_paper.html

A Survey on Audio Synthesis and Audio-Visual Multimodal Processing

该篇文章总结的范围更加广泛，包括语音合成，音乐生成和音视频多模态等等。虽然该篇文章没有上边谭旭文章的详细，但对多个领域进行整理。

语音合成论文优选：语音合成综述（2021）相关推荐

语音合成论文优选：M2voc大赛总结The M2voc Challenge 2021
声明:语音合成论文优选系列主要分享论文,分享论文不做直接翻译,所写的内容主要是我对论文内容的概括和个人看法.如有转载,请标注来源. 欢迎关注微信公众号:低调奋进 The Multi-speaker M ...
语音合成论文优选：Flavored Tacotron: Conditional Learning for Prosodic-linguistic Features
声明:语音合成论文优选系列主要分享论文,分享论文不做直接翻译,所写的内容主要是我对论文内容的概括和个人看法.如有转载,请标注来源. 欢迎关注微信公众号:低调奋进 Flavored Tacotron: ...
语音合成论文优选：唇语Speaker disentanglement in video-to-speech conversion
声明:语音合成论文优选系列主要分享论文,分享论文不做直接翻译,所写的内容主要是我对论文内容的概括和个人看法.如有转载,请标注来源. 欢迎关注微信公众号:低调奋进 Speaker disentangle ...
语音合成论文优选：Unified Mandarin TTS Front-end Based on Distilled BERT Model
声明:语音合成论文优选系列主要分享论文,分享论文不做直接翻译,所写的内容主要是我对论文内容的概括和个人看法.如有转载,请标注来源. 欢迎关注微信公众号:低调奋进 Unified Mandarin TT ...
语音合成论文优选：Efficiently Trainable Text-to-Speech System Based on Deep Convolutional Networks with Guide
声明:语音合成论文优选系列主要分享论文,分享论文不做直接翻译,所写的内容主要是我对论文内容的概括和个人看法.如有转载,请标注来源. 欢迎关注微信公众号:低调奋进 Efficiently Trainab ...
语音合成论文优选:音素韵律控制Prosodic Clustering for Phoneme-level Prosody Control in End-to-End Speech Synthesis
声明:平时看些文章做些笔记分享出来,文章中难免存在错误的地方,还望大家海涵.搜集一些资料,方便查阅学习:http://yqli.tech/page/speech.html.语音合成领域论文列表请访问h ...
语音合成（TTS)论文优选：Accent and Speaker Disentanglement in Many-to-many Voice Conversion
声明:语音合成(TTS)论文优选系列主要分享论文,分享论文不做直接翻译,所写的内容主要是我对论文内容的概括和个人看法.如有转载,请标注来源. 欢迎关注微信公众号:低调奋进 Accent and Spe ...
语音合成（TTS)论文优选：End-to-End Code-Switching TTS with Cross-Lingual Language Model
声明:语音合成(TTS)论文优选系列主要分享论文,分享论文不做直接翻译,所写的内容主要是我对论文内容的概括和个人看法.如有转载,请标注来源. 欢迎关注微信公众号:低调奋进 End-to-End Cod ...
语音合成TTS论文优选：A HYBRID TEXT NORMALIZATION SYSTEM USING MULTI-HEAD SELF-ATTENTION FOR MANDARIN
声明:语音合成(TTS)论文优选系列主要分享论文,分享论文不做直接翻译,所写的内容主要是我对论文内容的概括和个人看法.如有转载,请标注来源. 欢迎关注微信公众号:低调奋进 A HYBRID TEXT ...

语音合成论文优选：语音合成综述（2021）

语音合成论文优选：语音合成综述（2021）相关推荐

最新文章

热门文章