1. Free ST Chinese Mandarin Corpus
    • 在室内安静的环境中录制的,所有的话语都经过了仔细的转录和核对,精度较高。
    • 语料库包含: 音频文件,转录,元数据。
    2.   Primewords Chinese Corpus Set 1
    • 免费的,中文普通话,用手机录制,转录精度大于98%
    • 转序和词句之间的映射以json格式提供
    3. THCHS30
    • 通过单个碳粒麦克风录取
    • 内容全部是女生,文章以诗句为主。
    4. ST-CMDS
    • 内容以平时的网上聊天和智能语音控制语句为主
    • 有男生有女生,适合多种场景下使用
    5. MAGICDATA Mandarin Chinese Read Speech Corpus
    • 移动端的录音。
    • 录音者来自中国的不同区域
    • 在安静的室内环境中进行
    • 提供分段的成绩单
    • 录音文本领域多样化
    6. AISHELL
    • 具有不同的口音
    • 在安静的室内录制,同时使用三种不同设备进行录音。 
    • 手动转录率达到95%
    7. MobvoiHotwords
    他是商业智能扬声器手机的唤醒单词的语料库,它由关键字和非关键字组成
    8. CMU-MOSEI
    • 规模最大的三模态数据集
    • 具有情感和情绪两个标签
    • 但是每一个样本对应的可能不止一种情绪标签,对应的情绪强弱也不同
    9. UR-FUNNY
    • 包含文本、语音、图像三个模态
    10. CH-SIMS
    • 给出常规的文本、图片和语音
    • 标签更加细致,不仅有最终的标签,还有各个模态的标签。
    11. IEMOPCAP----最常用的数据集。

语音及多模态语音数据集总结相关推荐

  1. 基于音频和文本的多模态语音情感识别(一篇极好的论文,值得一看哦!)

    基于音频和文本的多模态语音情感识别 语音情感识别是一项具有挑战性的任务,在构建性能良好的分类器时,广泛依赖于使用音频功能的模型.本文提出了一种新的深度双循环编码器模型,该模型同时利用文本数据和音频信号 ...

  2. 小米AI实验室六篇论文获 ICASSP 2022收录,多模态语音唤醒挑战赛夺冠

    近日,全球语音.声学顶级会议ICASSP 2022公布了论文入选名单,小米AI实验室6篇学术论文被接收.同时,小米"自由说"系统在MISP(基于多模态信息的语音处理)挑战赛中荣获多 ...

  3. 小米AI实验室六篇论文获ICASSP2022收录,多模态语音唤醒挑战赛夺冠

    1月22日,全球语音.声学顶级会议ICASSP 2022公布了论文入选名单,小米AI实验室6篇学术论文被接收.小米"自由说"系统在MISP(基于多模态信息的语音处理)挑战赛中荣获多 ...

  4. 史上最大多模态图文数据集发布!

    文 | 付瑶 编 | 小轶 最近多模态研究圈中出现了一个扬言 "史上最大规模"的多模态图文数据集:LAION-400.该数据集在今年8月完全公开,共计公开了 4亿图文对,可以依据不 ...

  5. 多模态分析数据集(Multimodal Dataset)整理

    这里整理一下平时所用的多模态数据集以备之用,主要分为 多模态情感分析数据集 多模态问答数据集 多模态检索(匹配)数据集 后面会不断地去添加,也希望能够帮到其他人,欢迎大家补充. [0].多模态以及其他 ...

  6. 微软语音 文本到语音_建立自己的语音助手第1部分文本到语音

    微软语音 文本到语音 Disclaimer: we will not be training neural nets in this example but rather use pre-traine ...

  7. 语音信号处理:语音增强DNN频谱映射

    本文为自学总结整理知识点使用 参考课程: 基于深度神经网络频谱映射的语音增强方法 引言 原理 数据集 语音数据集 TIMIT 噪声数据集 Noise-92 数据准备 无噪语音数据准备 生成含噪数据 噪 ...

  8. html5语音对讲,c#语音对讲demo

    开启前输入对方IP点击录音然后发送即可 资源下载此资源下载价格为2D币,请先登录 资源文件列表 语音/.vs/语音/v14/.suo , 43008 语音/语音/App.config , 189 语音 ...

  9. 树莓派-语音聊天机器人+语音控制引脚电平高低

    最近和几位本学院的研究生师兄师姐参加研究生电子设计大赛,自己也来折腾下之前没有搞完的语音控制小车.恰巧自己负责的是语音控制这部分,折腾了几天也差不多搞定啦-把自己的折腾套路总结一下,给一起折腾的小伙伴 ...

最新文章

  1. TensorFlow练习20: 使用深度学习破解字符验证码
  2. 原生socket穿透HTTP代理服务器
  3. 交换esc和左ctrl ;caps lock与右ctrl
  4. 习题1.9 有序数组的插入 (20 分)
  5. (转载)以太网最大帧和最小帧、MTU .
  6. 剑指offer--面试题12
  7. vscode --- 快捷键格式化代码时,分号消失
  8. 想念一个人是一种温馨,被别人想念是一种幸福
  9. 花了一周整理的,这是价值10W的32个Python项目!
  10. 云原生应用Go语言:你还在考虑的时候,别人已经应用实践
  11. 库路径及编译时查找头文件设置
  12. c语言中if内函数值为零,C语言——if(0)之后的语句真的不会执行吗?
  13. MySQL数据库的恢复-mysql数据库的恢复
  14. 虚拟机访问服务器文件夹,浅析CentOS8虚拟机访问Windows10主机文件夹方法
  15. UVM实战 卷I学习笔记14——OVM到UVM的迁移
  16. 怎么在qq空间引流?QQ空间生日栏怎么引流?
  17. WhatsApp聊天记录迁移新手机,备份如何找回和删除?
  18. tkinter将图标写入py文件
  19. 多台计算机使用一个硬盘,怎么实现多台电脑共用一块硬盘
  20. 抖音如何推广运营?抖音如何快速涨粉?

热门文章

  1. 高血压患者的饮食宜忌等
  2. 安卓Andriod Studio 下载安装
  3. 根据近邻列表法识别团簇—冷凝成核 Matlab+Ovito(上)
  4. Java多线程——计算1-20阶乘和
  5. vscode插入图片
  6. 电镀废镍水回收处理方法
  7. VC2015 qt 打包发布
  8. 百战程序员python资源_【百战程序员】Python 文件I/O
  9. 常用的归一化(Normalization) 方法:BN、LN、IN、GN
  10. LZW编码的学习与实现