语音及多模态语音数据集总结
1. Free ST Chinese Mandarin Corpus
• 在室内安静的环境中录制的,所有的话语都经过了仔细的转录和核对,精度较高。
• 语料库包含: 音频文件,转录,元数据。
2. Primewords Chinese Corpus Set 1
• 免费的,中文普通话,用手机录制,转录精度大于98%
• 转序和词句之间的映射以json格式提供
3. THCHS30
• 通过单个碳粒麦克风录取
• 内容全部是女生,文章以诗句为主。
4. ST-CMDS
• 内容以平时的网上聊天和智能语音控制语句为主
• 有男生有女生,适合多种场景下使用
5. MAGICDATA Mandarin Chinese Read Speech Corpus
• 移动端的录音。
• 录音者来自中国的不同区域
• 在安静的室内环境中进行
• 提供分段的成绩单
• 录音文本领域多样化
6. AISHELL
• 具有不同的口音
• 在安静的室内录制,同时使用三种不同设备进行录音。
• 手动转录率达到95%
7. MobvoiHotwords
他是商业智能扬声器手机的唤醒单词的语料库,它由关键字和非关键字组成
8. CMU-MOSEI
• 规模最大的三模态数据集
• 具有情感和情绪两个标签
• 但是每一个样本对应的可能不止一种情绪标签,对应的情绪强弱也不同
9. UR-FUNNY
• 包含文本、语音、图像三个模态
10. CH-SIMS
• 给出常规的文本、图片和语音
• 标签更加细致,不仅有最终的标签,还有各个模态的标签。
11. IEMOPCAP----最常用的数据集。
语音及多模态语音数据集总结相关推荐
- 基于音频和文本的多模态语音情感识别(一篇极好的论文,值得一看哦!)
基于音频和文本的多模态语音情感识别 语音情感识别是一项具有挑战性的任务,在构建性能良好的分类器时,广泛依赖于使用音频功能的模型.本文提出了一种新的深度双循环编码器模型,该模型同时利用文本数据和音频信号 ...
- 小米AI实验室六篇论文获 ICASSP 2022收录,多模态语音唤醒挑战赛夺冠
近日,全球语音.声学顶级会议ICASSP 2022公布了论文入选名单,小米AI实验室6篇学术论文被接收.同时,小米"自由说"系统在MISP(基于多模态信息的语音处理)挑战赛中荣获多 ...
- 小米AI实验室六篇论文获ICASSP2022收录,多模态语音唤醒挑战赛夺冠
1月22日,全球语音.声学顶级会议ICASSP 2022公布了论文入选名单,小米AI实验室6篇学术论文被接收.小米"自由说"系统在MISP(基于多模态信息的语音处理)挑战赛中荣获多 ...
- 史上最大多模态图文数据集发布!
文 | 付瑶 编 | 小轶 最近多模态研究圈中出现了一个扬言 "史上最大规模"的多模态图文数据集:LAION-400.该数据集在今年8月完全公开,共计公开了 4亿图文对,可以依据不 ...
- 多模态分析数据集(Multimodal Dataset)整理
这里整理一下平时所用的多模态数据集以备之用,主要分为 多模态情感分析数据集 多模态问答数据集 多模态检索(匹配)数据集 后面会不断地去添加,也希望能够帮到其他人,欢迎大家补充. [0].多模态以及其他 ...
- 微软语音 文本到语音_建立自己的语音助手第1部分文本到语音
微软语音 文本到语音 Disclaimer: we will not be training neural nets in this example but rather use pre-traine ...
- 语音信号处理:语音增强DNN频谱映射
本文为自学总结整理知识点使用 参考课程: 基于深度神经网络频谱映射的语音增强方法 引言 原理 数据集 语音数据集 TIMIT 噪声数据集 Noise-92 数据准备 无噪语音数据准备 生成含噪数据 噪 ...
- html5语音对讲,c#语音对讲demo
开启前输入对方IP点击录音然后发送即可 资源下载此资源下载价格为2D币,请先登录 资源文件列表 语音/.vs/语音/v14/.suo , 43008 语音/语音/App.config , 189 语音 ...
- 树莓派-语音聊天机器人+语音控制引脚电平高低
最近和几位本学院的研究生师兄师姐参加研究生电子设计大赛,自己也来折腾下之前没有搞完的语音控制小车.恰巧自己负责的是语音控制这部分,折腾了几天也差不多搞定啦-把自己的折腾套路总结一下,给一起折腾的小伙伴 ...
最新文章
- TensorFlow练习20: 使用深度学习破解字符验证码
- 原生socket穿透HTTP代理服务器
- 交换esc和左ctrl ;caps lock与右ctrl
- 习题1.9 有序数组的插入 (20 分)
- (转载)以太网最大帧和最小帧、MTU .
- 剑指offer--面试题12
- vscode --- 快捷键格式化代码时,分号消失
- 想念一个人是一种温馨,被别人想念是一种幸福
- 花了一周整理的,这是价值10W的32个Python项目!
- 云原生应用Go语言:你还在考虑的时候,别人已经应用实践
- 库路径及编译时查找头文件设置
- c语言中if内函数值为零,C语言——if(0)之后的语句真的不会执行吗?
- MySQL数据库的恢复-mysql数据库的恢复
- 虚拟机访问服务器文件夹,浅析CentOS8虚拟机访问Windows10主机文件夹方法
- UVM实战 卷I学习笔记14——OVM到UVM的迁移
- 怎么在qq空间引流?QQ空间生日栏怎么引流?
- WhatsApp聊天记录迁移新手机,备份如何找回和删除?
- tkinter将图标写入py文件
- 多台计算机使用一个硬盘,怎么实现多台电脑共用一块硬盘
- 抖音如何推广运营?抖音如何快速涨粉?