2022年4月语音合成(TTS)和语音识别(ASR)论文月报
论文统计每月更新一次,主要跟踪语音合成和语音识别的发展状况(很多文章都是在会议后才发出,但不影响统计。统计过程难免存在疏漏,因此统计结果仅供参考。所有文章语音合成领域统计列表请访问http://yqli.tech/page/tts_paper.html,语音识别领域论文统计请访问http://yqli.tech/page/asr_paper.html。开源语音数据查询 http://yqli.tech/page/data.html。
如何查找语音资料请参考文章https://mp.weixin.qq.com/s/eJcpsfs3OuhrccJ7_BvKOg)。读者有什么建议可以直接给我发消息,我将不断修改该统计。如有转载,请注明出处。欢迎关注微信公众号:低调奋进。
(这波居家要两周,希望早点回归正轨)
一 语音合成篇
表一给出具体分类说明。2022年4月的语音合成相关的文章有45篇,详情参见图1。表二和图2是语音合成的具体方向文章的情况。这个月的研究热点为声学模型、声码器和多模态。另外,歌唱合成和声音转换方向的文章数量下降一些。由于本月VoiceMOS Challenge 2022的原因,MOS相关工作增加。最后,无监督学习开始在合成领域得到关注。
表一 语音合成分类说明
分类 |
说明 |
前端 |
多音字,韵律,g2p等等。 |
声学模型 |
语言特征转声学特征,attention工作,多说话人以及双重学习 |
声码器 |
波形生成 |
个性化 |
少数据,脏数据应用等自适应 |
多语言 |
多语言模型 |
歌唱合成 |
歌唱和音乐合成 |
情感 |
风格和情感 |
多模态 |
主要搜集talking head文章 |
声音转换 |
基于GAN方案和特征解耦方案 |
S2S |
speech-to-speech |
其它 |
基于EEG合成,开源数据,MOS评测以及语音合成的应用 |
图1 语音合成论文总数
表二 语音合成论文分布情况
1月 | 2月 | 3月 | 4月 | |
前端 | 2 | 0 | 3 | 0 |
声学模型 | 4 | 5 | 17 | 8 |
声码器 | 1 | 5 | 7 | 5 |
个性化 | 1 | 2 | 4 | 3 |
多语言 | 1 | 1 | 0 | 3 |
歌唱合成 | 5 | 3 | 5 | 2 |
情感风格 | 2 | 2 | 1 | 3 |
多模态 | 4 | 3 | 2 | 5 |
声音转换 | 4 | 2 | 11 | 3 |
s2s | 1 | 0 | 2 | 1 |
其它 | 2 | 0 | 4 | 12 |
图2 语音合成论文分布情况柱状图
语音合成的文章列表请访问http://yqli.tech/page/tts_paper.html
2022.04月份的文章
二 语音识别篇
语音识别的文章分类参照表三说明。图3是语音识别文章总数。语音识别的研究方向具体情况参见表4和图4,很明显,无监督学习在语音识别成为最大的研究热点。
表三 语音识别分类说明
分类 |
说明 |
general |
包括传统、混合语音识别,以及对asr的优化 |
ctc |
ctc优化 |
rnn-t |
rnn-t的优化 |
aed |
aed优化 |
dataset |
开源数据库 |
data aug |
数据增广 |
lm |
语言模型研究 |
multilingual |
多语音系统以及code-switch |
personal |
少数据量自适应以及个性化ASR |
rescoring |
多种模型联合打分 |
unsupervised |
无监督或者自监督学习 |
accent ,dialect |
口音和方言 |
other |
其它方向研究,包括系统评价标准等等 |
robust | 鲁棒性 |
speaker diarization | speaker diarization |
multichannel |
多通道 |
图3 语音识别文章数量统计(单位:篇)
表4 语音识别研究方向分布情况
1月 | 2月 | 3月 | 4月 | |
general | 12 | 10 | 13 | 9 |
ctc | 1 | 0 | 2 | 5 |
rnn-t | 3 | 1 | 2 | 3 |
aed | 1 | 1 | 1 | 1 |
dataset | 3 | 0 | 3 | 2 |
data augmentation | 1 | 1 | 1 | 2 |
lm | 2 | 2 | 4 | 3 |
multilingual | 2 | 1 | 2 | 1 |
personal | 0 | 7 | 3 | 1 |
rescoring | 1 | 1 | 2 | 0 |
unsupervised | 2 | 3 | 17 | 19 |
accent | 1 | 0 | 0 | 2 |
multichannel | 0 | 4 | 1 | 1 |
robust | 0 | 0 | 5 | 2 |
other | 6 | 13 | 22 | 13 |
speaker diarization | 0 | 3 | 4 | 5 |
图4 语音识别研究方向柱状图
语音识别的文章列表请访问http://yqli.tech/page/asr_paper.html
2022.04月份语音识别具体文章
2022年4月语音合成(TTS)和语音识别(ASR)论文月报相关推荐
- 2022年1月语音合成(TTS)和语音识别(ASR)论文月报
论文统计每月更新一次,主要跟踪语音合成和语音识别的发展状况(很多文章都是在会议后才发出,但不影响统计.统计过程难免存在疏漏,因此统计结果仅供参考.所有文章语音合成领域统计列表请访问http://y ...
- 2022年6月语音合成(TTS)和语音识别(ASR)论文月报
论文统计每月更新一次,主要跟踪语音合成和语音识别的发展状况(很多文章都是在会议后才发出,但不影响统计.统计过程难免存在疏漏,因此统计结果仅供参考.所有文章语音合成领域统计列表请访问http://yql ...
- 2022年1~7月语音合成(TTS)和语音识别(ASR)论文月报
论文统计每月更新一次,主要跟踪语音合成和语音识别的发展状况(很多文章都是在会议后才发出,但不影响统计.统计过程难免存在疏漏,因此统计结果仅供参考.如何查找语音资料请参考文章https://mp.wei ...
- 2022年1~10月语音合成(TTS)和语音识别(ASR)论文月报
论文统计每月更新一次,主要跟踪语音合成和语音识别的发展状况(很多文章都是在会议后才发出,但不影响统计.统计过程难免存在疏漏,因此统计结果仅供参考.所有文章语音合成领域统计列表请访问http://yql ...
- 2022年3月语音合成(TTS)和语音识别(ASR)论文月报
论文统计每月更新一次,主要跟踪语音合成和语音识别的发展状况(很多文章都是在会议后才发出,但不影响统计.统计过程难免存在疏漏,因此统计结果仅供参考.所有文章语音合成领域统计列表请访问http://yql ...
- 2022年5月语音合成(TTS)和语音识别(ASR)论文月报
论文统计每月更新一次,主要跟踪语音合成和语音识别的发展状况(很多文章都是在会议后才发出,但不影响统计.统计过程难免存在疏漏,因此统计结果仅供参考.所有文章语音合成领域统计列表请访问http://y ...
- 2022年1~8月语音合成(TTS)和语音识别(ASR)论文月报
论文统计每月更新一次,主要跟踪语音合成和语音识别的发展状况(很多文章都是在会议后才发出,但不影响统计.统计过程难免存在疏漏,因此统计结果仅供参考.所有文章语音合成领域统计列表请访问http://yql ...
- 2022年2月语音合成(TTS)和语音识别(ASR)论文月报
论文统计每月更新一次,主要跟踪语音合成和语音识别的发展状况(很多文章都是在会议后才发出,但不影响统计.统计过程难免存在疏漏,因此统计结果仅供参考.所有文章语音合成领域统计列表请访问http://yql ...
- 2022年语音合成(TTS)和语音识别(ASR)年度总结
论文统计每月更新一次,主要跟踪语音合成和语音识别的发展状况(很多文章都是在会议后才发出,但不影响统计.统计过程难免存在疏漏,因此统计结果仅供参考.所有文章语音合成领域统计列表请访问http://yql ...
最新文章
- 环境图配置不存在pbr_小米11再曝光,硬件参数不存在短板,完全最高旗舰配置...
- 马斯克的星际飞船又炸了!回收时发动机重启失败,「横」着砸向地面
- [HNOI2011]数学作业 分段矩阵乘法
- 一个顶级程序员要多久才能独自写完Win10代码?
- DelphiBCB一线程序员开发经验
- 遍历对象键值对的两种方法
- 梦幻之旅--深入大规模芯片设计全过程
- 【工具使用】Keil5软件使用-基础使用篇
- 换个思维学领域建模方法和实践
- 第一代操盘手图解“庄家操盘五部曲”;股市不可不知的赚钱法则!
- SQL从特定位置检索记录
- 遇到PX Deq: reap credit等待事件
- 人力资源数据分析(包含数据来源文件)
- 30 张图带你揭秘 CPU 是如何制造出来的!
- 建立Baseline之repo,manifest
- TCP/IP之大明邮差
- maven总结(二)--基本操作之编译java文件
- 高校制作VR全景费用了解一下?
- 谷歌开放生成式AI Bard,百度文心一言《唐伯虎点秋香》出圈
- checkpoint = torch.load(args.state_dict) ->RuntimeError: CUDA error: out of memory