数据推荐 | 自然对话语音数据集
从目前的数据行业看,大部分语音识别数据都以朗读式训练数据为主,朗读式语音数据可以解决例如手机语音助手、车载语音助手、智能音箱、智能家电等较为简单的人机交互应用场景。
用户和机器之间通常是以单一短句的形式来对话或进行命令控制,用户往往会注意自己的语速和发音,本质是一种非自然状态下的发音。在这种场景下,朗读式语音数据可以满足语音识别算法的训练需求。
然而,随着语音识别技术在智能客服、智能会议等更多自然场景下的落地,朗读式语音数据的训练效果开始变得差强人意。由于日常生活中说话人的发音习惯更加自然,在发声时会有大量的连音、吞音、发音变形、咬字不清等,包括一些无意识的“嗯、啊、呃”等,说话人往往不会刻意去控制语音、发音习惯,多人同时交流时甚至会出现语句打断、抢话、交叠音等复杂语音现象,所以这种自然对话风格的语音识别率就不是很理想。
数据是人工智能的基础,要想使人工智能技术有更高的准确率,就需要和应用场景更加匹配的训练数据集。自然对话语音数据已经成为业内更急缺的数据集。
数据堂在采集自然对话语音数据时,完全没有预设语料,只给出话题列表,录音人从中挑选多个自己感兴趣并熟悉的话题展开对话,确保对话语音自然流畅。
目前数据堂拥有20万小时成品语音数据集,其中,自然对话风格的语音数据近4万小时,包括中文普通话、方言、英语、日语、韩语、印地语、越南语、阿拉伯语、西班牙语、法语、德语、意大利语等,发音人来自不同地域及城市、年龄性别覆盖均衡。所有音频都经过了严格的人工转写及质检,标注文本内容、有效句子的起止时间点、录音人身份标识等,句准确率高达95%以上。
数据推荐 | 自然对话语音数据集相关推荐
- 【好数推荐】方言语音数据集
随着人工智能应用领域的拓展,方言识别问题也越来越受到重视.但是方言与普通话不一样,方言语音识别要复杂得多. 中国的方言南北差异太大,哪怕同属于一个大的方言分区,也分歧异出,方言数据的采集,面临很多困难 ...
- 数据推荐 | 人体行为识别数据集
人体行为识别任务旨在通过对人体姿态进行分析,识别出人体的具体动作,为人体行为预测.突发事件处理.智能健身.智能看护等领域提供技术支持. 人体行为识别数据标注方式 人体行为数据通用的标注方式包括人体关键 ...
- 好数推荐 数据堂平均音色语音库
语音合成,即是把文字变成声音的技术,声音是文字内容的信息载体.语音交互是日常生活中最常见.最被人熟悉并乐于接受的展现形式,语音交互体验效果的好坏,会对用户的感知造成很大影响. 如果语音合成质量较好,说 ...
- 【好数推荐】数据堂平均音色语音库
语音合成,即是把文字变成声音的技术,声音是文字内容的信息载体.语音交互是日常生活中最常见.最被人熟悉并乐于接受的展现形式,语音交互体验效果的好坏,会对用户的感知造成很大影响. 如果语音合成质量较好,说 ...
- 仅用 1/4 数据量还原真人语音100%细节,火山语音上新超自然对话语音合成技术...
数星星盼月亮,万千杰迷苦等6年,不久之前终于等到周董发新专辑啦!一经上线引爆全网讨论,就像这样: 正当大家沉浸在对那时青葱岁月的美好追忆时,发来上述这段音频的小伙伴表示:这段对话居然是语音合成的!提到 ...
- 仅用1/4数据量还原真人语音100%细节 火山语音上新超自然对话语音合成技术
数据智能产业创新服务媒体 --聚焦数智 · 改变商业 如今,数字化转型成为了抓住新一轮科技革命和产业变革浪潮的关键.无论是中国还是全球其他经济体,都将破局点聚焦于数字化转型.能否成功实现全面的数字化 ...
- 数据推荐 | 手势识别训练数据集
多样化,有按键.语音等,也由于整个疫情的大环境下,一种更方便更卫生更符合人们的非接触式交互方式-手势识别正大步发展,极富图像化和具备行动性的手势操作将会与人们的生活息息相关. 手势识别应用场景广泛,常 ...
- 车辆自然驾驶轨迹数据集/交通流数据介绍
文章目录 NGSIM NGSIM 概览 快速路车道选择算法 Interstate 80 Freeway 数据集 Lankershim Boulevard 数据集 US highway101数据集 动态 ...
- 1400小时开源语音数据集,你想要都在这儿
整理 | 一一 出品 | AI科技大本营(ID:rgznai100) 3 月 1 日,由 Mozilla 基金会发起的 Common Voice 项目,发布新版语音识别数据集,包括来自 42000 名 ...
最新文章
- jquery文件上传控件 Uploadify
- 中国自动化学会平行智能专业委员会成立
- 把JavaScript代码写在css里
- python语言特性-------python2.7教程学习【廖雪峰版】(一)
- [C++STL]仿函数用法介绍
- CSDN写博客(字体颜色、大小)
- java客户端程序用什么自动化测试_五大Java自动化测试框架
- [Android] 开源View组件(一)
- 【转】职业生涯30年的规划(经典)
- ASP.NET企业开发框架IsLine FrameWork系列之八--AppLogProvider日志框架(下)
- 30岁之前创业成功的12个要点
- 【Antlr】修改由Antlr生成的表示式?替换遍历方式?
- 三个数据分析里最难攻破的“悖论”,每一个都令人费解
- [leetcode]5179. 将二叉搜索树变平衡
- 使用文件流的方式将 DataTable 导入到 Excel 中
- 服务器系统在虚拟机安装win7系统安装教程,虚拟机安装教程图解 虚拟机安装win7步骤...
- android 模拟器 安装教程,电脑用安卓模拟器详细安装教程
- 什么是射频信号发生器?信号发生器具有哪些特点?(二)
- 三极管专题:镜像电流源
- ognl.NoSuchPropertyException(没有对应属性异常)