AISHELL-4是一个通过麦克风阵列实录的八通道中文普通话会议场景语音数据集。该数据集共包含211场会议,每场会议4至8人,数据集共120小时左右。该数据集旨在促进实际应用场景下多说话人处理的研究。AISHELL-4数据包括了实际会议场景下各种重要特性,例如停顿、重叠、说话人轮转、噪声等。同时数据集提供了准确的音字转写文本及时间戳信息,方便研究者进行诸如前端处理、语音识别、说话人分割等单独任务,并可以进行联合优化。

The AISHELL-4 is a sizable real-recorded Mandarin speech dataset collected by 8-channel circular microphone array for speech processing in conference scenario. The dataset consists of 211 recorded meeting sessions, each containing 4 to 8 speakers, with a total length of 120 hours. This dataset aims to bride the advanced research on multi-speaker processing and the practical application scenario in three aspects. With real recorded meetings, AISHELL-4 provides realistic acoustics and rich natural speech characteristics in conversation such as short pause, speech overlap, quick speaker turn, noise, etc. Meanwhile, the accurate transcription and speaker voice activity are provided for each meeting in AISHELL-4. This allows the researchers to explore different aspects in meeting processing, ranging from individual tasks such as speech front-end processing, speech recognition and speaker diarization, to multi-modality modeling and joint optimization of relevant tasks. We also release a PyTorch-based training and evaluation framework as baseline system to promote reproducible research in this field.

120 小时 丨 120 Hours

211 场会议 丨 211 Meeting Sessions

10个 会议室 丨 10 Meeting Rooms

60 人 丨 60 Speakers

Speech front-end processing

Speech Recognition

Speaker Diarization

开源系统

Open Source


AISHELL-4 is part of the AISHELL-ASR0055 Corpus

The setup of the recording environment.

20 个会议室 丨 20 Meeting Rooms

639 场会议 丨 639 Meeting Sessions

370 小时/单通道 丨 370 Hours/Single Channel

162 人 丨 162 Speakers

http://www.aishelltech.com/aishell_4http://www.aishelltech.com/aishell_4

AISHELL-4 多通道中文会议语音数据库相关推荐

  1. ICASSP 2022丨多通道多方会议转录(M2Met)国际挑战赛

    竞赛简介 语音识别(Automatic Speech Recognition).说话人日志(Speaker Diarization)等语音处理技术的最新发展激发了众多智能语音的广泛应用.会议场景是语音 ...

  2. AliSSR 语音超分算法:让在线会议语音更明亮更自然

    超分让在线会议语音更明亮,在线会议已成为日常工作中较为普遍的沟通交流方式,接入会议的方式也呈现多样化,比如电脑入会.手机入会又或是电话入会. 雪雅.曜辰|作者 众所周知,高采样率且高带宽的音频信号富含 ...

  3. 打造Android的中文Siri语音助手

    打造Android的中文Siri语音助手(一)--小I机器人的接口 分类: android2011-12-02 14:10 7879人阅读 评论(44) 收藏 举报 androidstringpath ...

  4. latex_3_中文会议论文模板以及修改过程中遇到的问题的解决方案

    latex中文会议论文模板以及修改过程中遇到的问题的解决方案 latex中文会议论文模板 1 报出错误: LaTex Error: File "picins.sty" not Fo ...

  5. 腾讯会议核心数据库TDSQL,如何做到快速无损在线扩容?

    自去年12月底发布后,腾讯会议40天更新14个版本,8天紧急扩容超过10万台云主机,投入的计算资源超100万核.疫情复工期间,每周都有数万家企业和政府相关机构使用腾讯会议复工复产,通过腾讯会议开拓了云 ...

  6. 存储计算解耦合,构建中国人英语语音数据库

    简介: 通过阿里云为流利说量身打造的数据湖解决方案,解决了流利说多种应用的各类数据的统一存储,帮助流利说构建数据规模高达上千亿的"中国人英语语音数据库". 公司介绍 流利说是世界领 ...

  7. 数据堂智能语音数据库,让客服更智能

    原标题:数据堂智能语音数据库,让客服更智能 拨打海底捞餐厅的客服电话,一个语气热情的女声从电话那头传来,很多人可能都没有意识到,这并不是人工客服,而是智能电话机器人的声音. 同样,当你拨打10086/ ...

  8. 知名科幻作家称AI让富者更富、穷者更穷 | 思科推出全球首款人工智能会议语音助手

    每一个企业级的人 都置顶了 中国软件网 中国软件网 为你带来最新鲜的行业干货   小编点评 马云家的鲁班双十一设计4亿张海报 设计师内牛满面 今日头条家的张小明吃着火锅唱着歌写了200篇稿 记者们目瞪 ...

  9. 打造Android的中文Siri语音助手(一)——小I机器人的接口

    Iphone4S的Siri让人眼前一亮,网上出现了无数调戏Siri的视频.真是让android用户们心痒不已.好在随后android阵营中的高手迅速反击,推出了Iris.悲剧的是Iris仅支持英文,让 ...

最新文章

  1. C++ 重载运算符简单举例
  2. Java多线程编程实战:模拟大量数据同步
  3. 历届华人 AAAI Fellows
  4. ubuntu安装Java开发环境
  5. c# mvc5 view 多层_MVC5+EF6 入门完整教程13 -- 动态生成多级菜单
  6. [css] :placeholder-shown和:focus-within这两个伪类你有使用过吗?说说看
  7. FormsAuthenticationTicket基于forms的验证
  8. 解决Driver/library version mismatch
  9. 力扣836.矩形重叠
  10. 用C#实现MVC(Model View Control)模式介绍
  11. python写的crf训练代码
  12. 浅谈对JAVA堆栈的理解
  13. JavaScript设计模式之“单例模式“
  14. Centos7修改系统默认启动项
  15. CF连杀喊话_WeGame修改
  16. C语言函数指针使用的一个例子(Win10,VS2022)
  17. 如何keil4下面创建工程?
  18. js实现颜色从蓝色渐变到红色
  19. 数据结构第二次实验-赫夫曼编码及其应用
  20. mysql 1433端口映射_常见路由器的1433端口映射讲解

热门文章

  1. 【01】【HTML】
  2. Conference Paper和Conference Proceeding的区别
  3. 视频教程-一夫老师PR教程Premiere CC2018抖音影视后期视频剪辑制作教程-其他
  4. Android App Bundle打包发布GooglePlay
  5. [附源码]java毕业设计游戏网站设计
  6. android 开发艾特功能,Android 仿微博@ # 艾特 话题功能
  7. wifi定频操作rtwpriv移植编译
  8. Codeforces Round #FF (Div. 2)C.DYZ Loves Sequence
  9. 学生党福利!学习python电脑及配置大盘点,游戏学习两不误
  10. 记录:我是如何在Mac上卸载adobe的