来源 | HyperAI超神经

头图 | 来源于网络 侵删

方言是语音识别技术发展中必须要迈过去的坎儿,那么如何让模型能够听懂和理解方言呢?使用优质的数据集是一种的方法,本文将介绍一个经典的方言录音数据集 TIMIT。

随着科技的成熟,语音识别技术已经走进生活的方方方面,但在方言识别和处理上却还是略显吃力。就拿美式英语来说,虽然书面表达接近标准化,但不同的地区,由于方言,口音,俚语等存在,发音的方式方法、词汇的拼法千差万别。

这导致语音系统在识别方言时会出现差错,甚至会闹出笑话。

方言,让智能音箱不懂你

2018 年,华盛顿邮报,Globalme 和 Pulse Labs (语音研究公司)合作,对主流的智能音箱做了一份测试,探究方言、口音对语音识别系统的影响。

美国 20 多个城市、超 100 名参与者进行了测试,他们发出的数千条方言语音命令,被主流智能音响识别时,识别结果存在着显著的差异。

不同口音的识别准确率区别很大

其中,Google Home 识别西岸口音的准确率,比识别南方口音高 3%;而亚马逊的语音助手 Alexa,识别中西部口音的准确率,要比东岸口音低 2%。

也就是说,智能音箱并不能对各地方言进行通吃。而最严重的问题,发生在识别非本土口音时。

对于移民群体的发音,Google Home 或者 Amazon Echo 的英语识别,准确率都特别低。其中对于拉丁裔和华裔群体,用 Alexa 识别的内容,不准确率达到了 30%。

听不懂?可能是数据没到位

想要解决这个问题,就需要让 AI 听懂不同方言的语音,从而在交互中分辨出真要表达的语句。对于这个困境,谷歌和亚马逊都曾提到了基于数据的解决方案。

亚马逊在一份声明中称,随着使用不同方言的人和 Alexa 进行交流,它的理解能力会得到改善。」而谷歌表示,「在扩大多样化数据集的同时,将继续提高 Google Home 的识别能力。」

某种层面来将,语音识别中的方言、口音识别问题,可归咎于数据不足。语料库的质量越高,语言模型越多种多样,理论上来说语音识别系统的准确率越高。

美国英语口音分布地图

所以要解决方言识别的,有效的一种方式是拥有优质的数据集。

而 TIMIT 方言录音数据集,就是早期的数据科学家们,意识到此类问题后构建而来,它也很好地背负起了训练方言识别的使命。

问世 20 年,还被广泛使用

TIMIT 方言录音数据集,于1993 年推出,涵盖了 8 种主要美国英语方言共 6300 个录音片段,旨在帮助语音系统中方言识别的开发和评估。

TIMIT 方言录音数据集

包含数量:6300 个方言录音片段

数据格式:wav\txt\wrd\phn

采样方式:16 KHz  16 bit

数据大小:419.82 MB

发布时间:1993 年

包含内容:录音片段、句子、单词、因素内容

下载地址:https://hyper.ai/datasets/5684

该数据集由麻省理工学院、SRI 国际和德州仪器公司合作而得到,具有 630 位采集者,每人提供 10 个语音丰富的句子录音。

因为指定了测试和培训集,数据集很好地平衡了语音和方言的覆盖范围。

训练集和测试集的分配

其内容包括一些与话语句子相关的文件,除了语音波形文件(.wav)外,还包括对应的句子内容(.txt),经过时间对齐(time-aligned)的单词内容(.wrd),经过时间对齐(time-aligned)的音素内容(.phn)三种类型的文件。

数据集包含多种句子类型

作为语音识别领域的经典数据集,TIMIT 方言录音数据集被广泛使用,在谷歌学术列表中,有多篇高质量的论文引用,由此推动了语音识别实验的进展。

二十多年后,该数据集仍然被广泛使用在语音识别的研究之中。

由于数据集每个句子都在音素级别上进行了手动标记,同时提供了说话人的编号,性别,方言种类等多种信息,在今日仍然不显落后。

另外数据集很小,能在短时间内完成模型训练,同时又足以展示出系统的性能。

虽然数据并不能完全解决语音识别中的方言和口音问题,但拥有更好的方言数据集,将是破解这个问题的关键一步。

更多精彩推荐
无人机、IoT 设备都有漏洞?专访以色列老牌安全企业Check Point
听完姚期智的一句“嘟囔”,他开始第二次创业AI 3D 传感器市场竞争白热化,中国掌握自主可控核心技术时不我待!小心!你家的 IoT 设备可能已成为僵尸网络“肉鸡”点分享点收藏点点赞点在看

让语音助手听懂方言,这个数据集能搞定相关推荐

  1. 想让语音助手听懂方言,这个数据集或能帮你?

    By 超神经 内容概述:方言是语音识别技术发展中必须要迈过去的坎儿,那么如何让模型能够听懂和理解方言呢?使用优质的数据集是一种的方法,本文将介绍一个经典的方言录音数据集 TIMIT. 关键词:语音识别 ...

  2. php文字转语音amr,如何将文字转成语音?这几个方法一分钟搞定!

    原标题:如何将文字转成语音?这几个方法一分钟搞定! 文字转语音在我们的生活中已经广泛使用了,早晨起床想要看看新闻,但是又无奈时间不够,这时不必慌张,想要了解新闻事件,我们直接把这些文字转为语音,随时随 ...

  3. 怎样将语音翻译成文字?实现语音翻译文字这两招帮你搞定

    不知道有没有人和我一样,闲暇时间就喜欢坐下来听歌,通常我喜欢将自己听到的一些好的歌曲保存下来,并且想把里面的每一句歌词记录在我的小本本上,但是一句句抄的话太耽误时间了,有没有好的办法呢?如何在不用抄的 ...

  4. 怎么把文字转语音?这三个方法教你搞定文字转语音

    相信大家对这个问题并不陌生吧!当我们在写论文或者工作时,会有很多的文件需要查阅,长时间盯着文字看难免会觉得眼睛疲劳,其实这时候我们可以将文字内容转换成语音播放出来,就能解放双眼双手,那么我们怎么把文字 ...

  5. 干净利落的消除网页全局事件监听,匿名函数也可以搞定,一文让你掌握同步CSDN文章到公众号的技巧,从此远离繁重的编辑工作

  6. 会议模版 + 语音通话 + 视角跟随 + 接力,一篇文档搞定开会全流程

    妙记多 Mojidoc 上两周开始正式内测邀请,有很多协同工具类的朋友关注并参与了内测,同时给我们提供了很多宝贵意见,我们将每日修复的问题和新功能记录在了这个文档中.也有很多朋友提出了疑问,妙记多 M ...

  7. 进不了系统不要怕,看懂Linux系统引导分分钟搞定!

    Linux引导过程与服务控制 一.Linux操作系统引导过程 1.1 引导过程图解 1.2 引导过程详解 1.3 系统初始化进程 1.4 Systemd 单元类型 1.5 运行级别所对应的System ...

  8. 标贝科技|智能语音助手+全息形象,会是下一个趋势吗

    现在,智能语音助手已经无处不在,手机.音箱.电视.汽车里都能寻得他们的踪迹.他们都有一些相似的点:能识别语音.说唤醒词就能开始对话.可以完成人们的各种指令,除了内在技能以外,在外表上,他们目前也都没有 ...

  9. Python构建您自己的交互式语音助手 Voice Assistant with Python – Alexa Clone

    构建您自己的交互式语音助手 你会学到: 构建虚拟助理 使用API 根据个人需求修改语音助手 Python编程 MP4 |视频:h264,1280×720 |音频:AAC,44.1 KHz,2 Ch 语 ...

最新文章

  1. 企业应用架构模式 读书笔记
  2. java web 润乾报表教程_润乾报表开发 基础教程.ppt
  3. FusionCharts-堆栈图、xml格式、刷新数据、添加事件link、传参
  4. 【剑指Offer】07变态跳台阶
  5. VMvare虚拟机如何删除安装的ubuntu操作系统
  6. ssh 整合TOMCAT启动遇到错误
  7. 遇到oracle错误20001,IMP-00003: 遇到 ORACLE 错误 20001
  8. bzoj1627 / P2873 [USACO07DEC]泥水坑Mud Puddles
  9. .mp4视频测试地址
  10. 百度云c++语言模拟器,Android模拟器中运行纯C++程序(一)
  11. 判断IE版本并给出提示升级浏览器
  12. ubuntu18.04 下海康工业相机hikrobot_camera的使用及问题的解决
  13. 举个栗子~Minitab 技巧(5):掌握常用快捷键,提高统计分析效率
  14. 大恒水星相机+opencv4.0.1保存视频
  15. Mooc_AutoCAD绘制建筑施工图_单元平面图测验题
  16. mac 在连接wifi时出现“无互联网连接”的警告,叹号
  17. 简单并查集-加边的无向图
  18. CPI成折叠式OLED面板保护层关键材料
  19. Matlab2020a安装
  20. 财富宣言_必须阅读:休闲游戏宣言

热门文章

  1. 如何利用微信小游戏的分包加载机制突破4M代码包体积限制
  2. 阿里重金投数梦工场 布局PaaS动了谁的奶酪
  3. 使用Powershell管理Linux 下的 SQL Server
  4. “Uncaught TypeError: string is not a function”
  5. linux下使profile和.bash_profile立即生效的方法
  6. 网页解析:如何获得网页源码中嵌套的标签。
  7. Api 函数: GetCursorPos 与转换
  8. IDEA创建子项目 parent标签报错
  9. mysql filter_MySQL 过滤复制+复制映射 配置方法
  10. Pycharm中如何安装python库