语音合成论文优选:语音合成综述(2021)
声明:工作以来主要从事TTS工作,平时看些文章做些笔记。文章中难免存在错误的地方,还望大家海涵。平时搜集一些资料,方便查阅学习:TTS 论文列表 http://yqli.tech/page/tts_paper.html TTS 开源数据 http://yqli.tech/page/data.html。如转载,请标明出处。欢迎关注微信公众号:低调奋进
我感觉一个领域的成熟标志就是综述文章的出现,从4月份到现在已经有三篇高质量的综述文章发出,本文主要向读者推荐该三篇文章。虽然我已经阅读了这三篇文章,但我不想直接翻译出来。读者想学习更多的知识,需要自己通读一遍。(综述的文章都很简单,阅读综述文章其实是一种享受).
1Review of end-to-end speech synthesis technology based on deep learning
西安交通大学在4月份更新的文章
2 A Survey on Neural Speech Synthesis
亚洲微软在6月份更新的文章
3 A Survey on Audio Synthesis and Audio-Visual Multimodal Processing
中国电子科技大学在8月份更新的文章
Review of end-to-end speech synthesis technology based on deep learning
该篇文章主要介绍基于神经网络的语音合成技术,也就是近五年来的发展状况。该篇文章的重点在声学模型和声码器的介绍已经优缺点,当然也简单总结了可用的数据集。
A Survey on Neural Speech Synthesis
重点向大家推荐这篇谭旭撰写的这篇文章。该篇文章的组织架构更加清晰简洁而且更加全面。该文章从多个角度进行分类归纳,首先从TTS的每个组成部分进行归纳,然后对TTS前沿话题进行归纳。
图三展示的是按照TTS组成进行划分,图6对模型的进化史进行全面展示,这个张图还是挺有意思。最后的图7总结了TTS的前沿话题。最后,本文对TTS的从代码库和数据也进行总结。
我的文章分类其实跟谭旭这篇文章类似,大家想一直跟踪行业文章发表情况可以收藏我的网站http://yqli.tech/page/tts_paper.html
A Survey on Audio Synthesis and Audio-Visual Multimodal Processing
该篇文章总结的范围更加广泛,包括语音合成,音乐生成和音视频多模态等等。虽然该篇文章没有上边谭旭文章的详细,但对多个领域进行整理。
语音合成论文优选:语音合成综述(2021)相关推荐
- 语音合成论文优选:M2voc大赛总结The M2voc Challenge 2021
声明:语音合成论文优选系列主要分享论文,分享论文不做直接翻译,所写的内容主要是我对论文内容的概括和个人看法.如有转载,请标注来源. 欢迎关注微信公众号:低调奋进 The Multi-speaker M ...
- 语音合成论文优选:Flavored Tacotron: Conditional Learning for Prosodic-linguistic Features
声明:语音合成论文优选系列主要分享论文,分享论文不做直接翻译,所写的内容主要是我对论文内容的概括和个人看法.如有转载,请标注来源. 欢迎关注微信公众号:低调奋进 Flavored Tacotron: ...
- 语音合成论文优选:唇语Speaker disentanglement in video-to-speech conversion
声明:语音合成论文优选系列主要分享论文,分享论文不做直接翻译,所写的内容主要是我对论文内容的概括和个人看法.如有转载,请标注来源. 欢迎关注微信公众号:低调奋进 Speaker disentangle ...
- 语音合成论文优选:Unified Mandarin TTS Front-end Based on Distilled BERT Model
声明:语音合成论文优选系列主要分享论文,分享论文不做直接翻译,所写的内容主要是我对论文内容的概括和个人看法.如有转载,请标注来源. 欢迎关注微信公众号:低调奋进 Unified Mandarin TT ...
- 语音合成论文优选:Efficiently Trainable Text-to-Speech System Based on Deep Convolutional Networks with Guide
声明:语音合成论文优选系列主要分享论文,分享论文不做直接翻译,所写的内容主要是我对论文内容的概括和个人看法.如有转载,请标注来源. 欢迎关注微信公众号:低调奋进 Efficiently Trainab ...
- 语音合成论文优选:音素韵律控制Prosodic Clustering for Phoneme-level Prosody Control in End-to-End Speech Synthesis
声明:平时看些文章做些笔记分享出来,文章中难免存在错误的地方,还望大家海涵.搜集一些资料,方便查阅学习:http://yqli.tech/page/speech.html.语音合成领域论文列表请访问h ...
- 语音合成(TTS)论文优选:Accent and Speaker Disentanglement in Many-to-many Voice Conversion
声明:语音合成(TTS)论文优选系列主要分享论文,分享论文不做直接翻译,所写的内容主要是我对论文内容的概括和个人看法.如有转载,请标注来源. 欢迎关注微信公众号:低调奋进 Accent and Spe ...
- 语音合成(TTS)论文优选:End-to-End Code-Switching TTS with Cross-Lingual Language Model
声明:语音合成(TTS)论文优选系列主要分享论文,分享论文不做直接翻译,所写的内容主要是我对论文内容的概括和个人看法.如有转载,请标注来源. 欢迎关注微信公众号:低调奋进 End-to-End Cod ...
- 语音合成TTS论文优选:A HYBRID TEXT NORMALIZATION SYSTEM USING MULTI-HEAD SELF-ATTENTION FOR MANDARIN
声明:语音合成(TTS)论文优选系列主要分享论文,分享论文不做直接翻译,所写的内容主要是我对论文内容的概括和个人看法.如有转载,请标注来源. 欢迎关注微信公众号:低调奋进 A HYBRID TEXT ...
最新文章
- 为什么可以说Java语言是准动态语言?
- 零基础python入门书籍推荐书目_铁粉看过来!送书啦,Python推荐书单,送书10本!...
- sql 跟踪工具sql profiler使用
- 灯光插件_Light Kit Pro 3灯光插件
- concat函數 函數concat 可以用來合拼兩個或以上的字串。
- iOS 开发-文件下载原理
- Java案例:接口的静态方法
- ROS学习笔记六:理解ROS服务和参数
- 【李宏毅2020 ML/DL】P20-21 Recurrent Neural Network | “Deep and structure is future.“
- 使用HALCON进行图像分类——图像分类(系统讲解,附模板例程精讲)
- 哈夫曼编码(Huffman Coding)原理详解
- 三栏式布局的几种实现方式
- php get month,JavaScript从Date对象返回月份 (0 ~ 11)的方法getMonth()
- 浅谈 Kafka Leader Epoch
- java itext5 插入一个艺术文字 (剪切蒙版)
- 麒麟座迷你板STLINK使用
- .NET网页显示饼形图
- Vim常用操作,normal模式、insert模式和visual模式
- Markdowm编辑器推荐和Emoji 表情
- 时光机与流浪者-我的2017