从目前的数据行业看,大部分语音识别数据都以朗读式训练数据为主,朗读式语音数据可以解决例如手机语音助手、车载语音助手、智能音箱、智能家电等较为简单的人机交互应用场景。

用户和机器之间通常是以单一短句的形式来对话或进行命令控制,用户往往会注意自己的语速和发音,本质是一种非自然状态下的发音。在这种场景下,朗读式语音数据可以满足语音识别算法的训练需求。

然而,随着语音识别技术在智能客服、智能会议等更多自然场景下的落地,朗读式语音数据的训练效果开始变得差强人意。由于日常生活中说话人的发音习惯更加自然,在发声时会有大量的连音、吞音、发音变形、咬字不清等,包括一些无意识的“嗯、啊、呃”等,说话人往往不会刻意去控制语音、发音习惯,多人同时交流时甚至会出现语句打断、抢话、交叠音等复杂语音现象,所以这种自然对话风格的语音识别率就不是很理想。

数据是人工智能的基础,要想使人工智能技术有更高的准确率,就需要和应用场景更加匹配的训练数据集。自然对话语音数据已经成为业内更急缺的数据集。
数据堂在采集自然对话语音数据时,完全没有预设语料,只给出话题列表,录音人从中挑选多个自己感兴趣并熟悉的话题展开对话,确保对话语音自然流畅。
目前数据堂拥有20万小时成品语音数据集,其中,自然对话风格的语音数据近4万小时,包括中文普通话、方言、英语、日语、韩语、印地语、越南语、阿拉伯语、西班牙语、法语、德语、意大利语等,发音人来自不同地域及城市、年龄性别覆盖均衡。所有音频都经过了严格的人工转写及质检,标注文本内容、有效句子的起止时间点、录音人身份标识等,句准确率高达95%以上。

数据推荐 | 自然对话语音数据集相关推荐

  1. 【好数推荐】方言语音数据集

    随着人工智能应用领域的拓展,方言识别问题也越来越受到重视.但是方言与普通话不一样,方言语音识别要复杂得多. 中国的方言南北差异太大,哪怕同属于一个大的方言分区,也分歧异出,方言数据的采集,面临很多困难 ...

  2. 数据推荐 | 人体行为识别数据集

    人体行为识别任务旨在通过对人体姿态进行分析,识别出人体的具体动作,为人体行为预测.突发事件处理.智能健身.智能看护等领域提供技术支持. 人体行为识别数据标注方式 人体行为数据通用的标注方式包括人体关键 ...

  3. 好数推荐 数据堂平均音色语音库

    语音合成,即是把文字变成声音的技术,声音是文字内容的信息载体.语音交互是日常生活中最常见.最被人熟悉并乐于接受的展现形式,语音交互体验效果的好坏,会对用户的感知造成很大影响. 如果语音合成质量较好,说 ...

  4. 【好数推荐】数据堂平均音色语音库

    语音合成,即是把文字变成声音的技术,声音是文字内容的信息载体.语音交互是日常生活中最常见.最被人熟悉并乐于接受的展现形式,语音交互体验效果的好坏,会对用户的感知造成很大影响. 如果语音合成质量较好,说 ...

  5. 仅用 1/4 数据量还原真人语音100%细节,火山语音上新超自然对话语音合成技术...

    数星星盼月亮,万千杰迷苦等6年,不久之前终于等到周董发新专辑啦!一经上线引爆全网讨论,就像这样: 正当大家沉浸在对那时青葱岁月的美好追忆时,发来上述这段音频的小伙伴表示:这段对话居然是语音合成的!提到 ...

  6. 仅用1/4数据量还原真人语音100%细节 火山语音上新超自然对话语音合成技术

    ‍数据智能产业创新服务媒体 --聚焦数智 · 改变商业 如今,数字化转型成为了抓住新一轮科技革命和产业变革浪潮的关键.无论是中国还是全球其他经济体,都将破局点聚焦于数字化转型.能否成功实现全面的数字化 ...

  7. 数据推荐 | 手势识别训练数据集

    多样化,有按键.语音等,也由于整个疫情的大环境下,一种更方便更卫生更符合人们的非接触式交互方式-手势识别正大步发展,极富图像化和具备行动性的手势操作将会与人们的生活息息相关. 手势识别应用场景广泛,常 ...

  8. 车辆自然驾驶轨迹数据集/交通流数据介绍

    文章目录 NGSIM NGSIM 概览 快速路车道选择算法 Interstate 80 Freeway 数据集 Lankershim Boulevard 数据集 US highway101数据集 动态 ...

  9. 1400小时开源语音数据集,你想要都在这儿

    整理 | 一一 出品 | AI科技大本营(ID:rgznai100) 3 月 1 日,由 Mozilla 基金会发起的 Common Voice 项目,发布新版语音识别数据集,包括来自 42000 名 ...

最新文章

  1. jquery文件上传控件 Uploadify
  2. 中国自动化学会平行智能专业委员会成立
  3. 把JavaScript代码写在css里
  4. python语言特性-------python2.7教程学习【廖雪峰版】(一)
  5. [C++STL]仿函数用法介绍
  6. CSDN写博客(字体颜色、大小)
  7. java客户端程序用什么自动化测试_五大Java自动化测试框架
  8. [Android] 开源View组件(一)
  9. 【转】职业生涯30年的规划(经典)
  10. ASP.NET企业开发框架IsLine FrameWork系列之八--AppLogProvider日志框架(下)
  11. 30岁之前创业成功的12个要点
  12. 【Antlr】修改由Antlr生成的表示式?替换遍历方式?
  13. 三个数据分析里最难攻破的“悖论”,每一个都令人费解
  14. [leetcode]5179. 将二叉搜索树变平衡
  15. 使用文件流的方式将 DataTable 导入到 Excel 中
  16. 服务器系统在虚拟机安装win7系统安装教程,虚拟机安装教程图解 虚拟机安装win7步骤...
  17. android 模拟器 安装教程,电脑用安卓模拟器详细安装教程
  18. 什么是射频信号发生器?信号发生器具有哪些特点?(二)
  19. 三极管专题:镜像电流源
  20. ognl.NoSuchPropertyException(没有对应属性异常)

热门文章

  1. 翻译翻译什么叫HTML5(六)“开门,js来查水表啦”
  2. 大数据必学Java基础(三十一):IDEA模板的使用
  3. IDEA-自定义常用代码块
  4. Win10 系统设置共享文件
  5. 数据结构----二叉树
  6. html中img显示图片的两种常用方式
  7. 夜曲 文/江湖一劍客
  8. 电子学会-全国青少年编程等级考试真题Scratch一级(2019年3月)
  9. 切换窗口快捷键 你知道吗?
  10. java输出美国的时间_java显示当前美国洛杉矶时间