• CSTR VCTK Corpus:英语语音,109个说话人,每个说话人平均400句话,每句话4至10秒,平行语料。
  • TIMIT Acoustic-Phonetic Continuous Speech Corpus:英语语音,630个说话人,每个说话人平均10句话,平行语料。
  • LibriSpeech:大型阅读英语语音语料库(目前大小,1000小时,57.2G)。LibriSpeech是由Vassil Panayotov在Daniel Povey的协助下编写的大约1000小时的16kHz阅读英语语音的语料库。数据来自LibriVox项目的有声读物,并经过仔细地分段和对齐。
  • TED-LIUM 语料库 TED-LIUM是通过Ubiqus公司与LIUM(法国勒芒大学)的合作完成的 SPH:2351音频对话,包括TED-LIUM 2的对话,452小时的音频,2351个对齐的STM格式。
  • VoxForge Voxforge 被设计来收集讲话转录文本,以供自由与开放源代码的语音识别引擎使用。
  • Tatoeba Tatoeba 是一个用于语言学习的句子、翻译和口语音频的大型数据库。此下载包含由其社区记录的所有口语。
  • Voice Conversion Challenge 2016 语音转换挑战赛(VCC)2016是VCC的第一版。
  • Voice Conversion Challenge 2018 语音转换挑战赛(VCC)2018是VCC的第二版,是一项大规模的语音转换挑战赛。 VCC 2018语料库是通过从设备和生产语音(DAPS)数据集[12]中选择说话者准备的,这些数据集是由专业的美国英语使用者在干净和无噪音的环境中录制的。参加挑战的参与者需要使用通过并行或非并行训练数据训练的VC系统,将语音信号从源说话者转换为目标说话者。已通过众包收听测试对参与挑战的所有并行和非并行VC系统进行了自然性和相似性评分评估。
  • Voice Conversion Challenge 2020 任务一1.半并行语音4输入语音,4目标语音,每人70句英文,20平行,50不平行。任务二1.不同句子,不同种族语言进行转换
  • The Blizzard Challeng2020 9.5小时普通话 3小时上海话 train700句子(New:500,PSC:100,INT:100,///TEST,New:291,Chet:100),test 391句子,普通话仅仅只有文字,上海话语音加文字。TTS数据集。
  • VOiCES Dataset

Voice conversion相关语音数据集综合汇总相关推荐

  1. 【论文学习笔记】《An Overview of Voice Conversion and Its Challenges》

    <An Overview of Voice Conversion and Its Challenges: From Statistical Modeling to Deep Learning&g ...

  2. 人脸识别相关的数据集汇总

    人脸识别相关的数据集汇总 自己整理了相关的人脸识别相关的 论文.数据集.算法资料.欢迎任何形式的star.fork和 watch. Updated: add Trillion Pairs and WF ...

  3. Mozilla发布最大公共语音数据集Common Voice

    近日,Mozilla发布了当前可使用的,规模最大的公共语音数据集Common Voice,数据集涵盖18种语言,由42000多名贡献者提供的近1400小时的语音数据构成. 文 / George Rot ...

  4. AI最全数据集汇总:语音、歌声、音乐、图片、视频等领域开源数据集链接汇总

    文章目录 **音乐数据集** 百万歌数据集 **语音数据集** 口语维基百科语料库 语音命令数据集 零资源语音挑战 ISOLET数据集 阿拉伯语言语料库 TIMIT语料库 **音响/自然** 环境音频 ...

  5. 数据集查找神器!100个大型机器学习数据集都汇总在这了 | 资源

    铜灵 发自 凹非寺 量子位 出品| 公众号 QbitAI 想自己构建机器学习模型,没想到首先就卡在了第一步. 网上各种数据集鱼龙混杂,质量也参差不齐,简直让人挑花了眼.想要获取大型数据集,还要挨个跑到 ...

  6. AI深度、机器学习数据集资源汇总

    文章目录 前言 一.数据集网站 二.具体数据集 1.记录的具体数据集 2.医疗图像 3.网上数据集汇总链接 总结 前言 继续收集.更新.汇总....................... 一.数据集网 ...

  7. 数据挖掘公开数据集【汇总】

    公开数据集指的是不同的公司.组织公开的用于机器学习.深度学习.人工智能等方向大规模数据集合.以下数据集可用于数据分析.数据挖掘和机器学习等大数据场景下的测试和学习. 按照数据工作的不同应用主题方向,分 ...

  8. 【VC/AC论文】Any-to-Many Voice Conversion withLocation-Relative Sequence-to-Sequence Modeling

    文章目录 Abstract Introduction Related Work Attention mechanisms in seq2seq model | seq2seq模型中的注意机制 A se ...

  9. Voice Conversion Across Arbitrary Speakers based on a Single Target-Speaker Utterance

    会议:2018interspeech 作者:MengHelen, liusongxiang, sunlifa Voice Conversion 项目笔记(含从VCC 2016匿名比赛深挖的各前沿方法性 ...

最新文章

  1. vrrp的组播地址是多少
  2. exec 执行结果_php执行系统外部命令的4种方法
  3. from torch._C import * ImportError: DLL load failed解决方法
  4. ImportError: No module named setuptools 解决方法
  5. php插不入数据原因,php程序插数据入mysql, 插入失败问题
  6. redis 哨兵 异步_redis 使用历程
  7. windows apache 开启 GZIP
  8. 千里眼摄像头支持对象存储吗_3.5ms超高速写入、支持125℃工作的EEPROM“BR24H-5AC系列”...
  9. 清华大学王媛老师的讲座
  10. ffmpeg2.8将多媒体文件保存为ppm
  11. 考研数学一基础技巧题汇总
  12. QDateTimeEdit使用
  13. 企业搜索引擎(Enterprise Search Engine)的2007中重要的功能
  14. android - 使用Parcelable序列化
  15. 贺利坚老师汇编课程70笔记:端口的读写
  16. selenium ruby和java_针对Ruby的Selenium WebDriver安装指南
  17. paip.数组以及集合的操作uapi java php python总结..
  18. AOD实践,modis数据下载,modis数据处理,
  19. Redis持久化 - 邱乘屹的个人技术博客
  20. HDS USPV-VSP HP XP24000 Raid崩溃阵列损坏多盘损坏数据恢复方法思路分享

热门文章

  1. Java 省市区三级联动
  2. eclipse 3.7 中英文自由切换
  3. 用selenium全自动化爬取教务系统作业清单
  4. 进入BeOS的花花世界 系列六
  5. 解决“C2001:常量中有换行符“编译问题
  6. centos7笔记本触摸板单击无反应
  7. STM32系列 STM32F4xx SPI Flash-读写操作
  8. 蓝牙相关学习:3.BLE协议物理层
  9. (二)进程管理之进程状态及组织方式
  10. php 实现无限极分类详解