据国外媒体报道,Vocalize.ai的实验室曾经对亚马逊的语音助手Alexa、苹果的语音助手Siri和谷歌的语音助手Google Assistant进行了一项语音识别能力测试。研究人员分别使用美国、印度、中国三个不同国家的口音英语对这三种语音助手进行了测试。来检测这些语音助手对口音英语的理解程度。


结果发现,Google Assistant在理解中国口音英语方面完全超过了其它两种语音助手。出现这种结果的主要原因是Google Assistant学习了中国口音英语数据而其他两种语音助手并没有学习。

作为一种国际通用语言,不同地区的英语口音存在较大差距是很正常的,有的地方英语口音大到听起来完全就是两种语言。如果AI不对不同地区的英语口音进行学习,很有可能闹出大乌龙。

无独有偶,去年印度空军就发现了从法国订购的“阵风”战斗机听不懂印度英语导致“阵风”的语音识别系统无法辨认印度飞行员的指令,甚至发生误判了。


最根本原因就是“阵风”战机的语音识别系统没有将各种不同语言和方言纳入数据库,在飞行过程中,飞行员很有可能因为发音不够标准,造成语音识别系统无法识别甚至误判。为了避免因为口音问题出现误判,现代战斗机的语音控制系统都必须经过长时间的调试、改进和升级,才能够满足需求。

当前阶段,标准英文ASR系统已经能够获得较高的识别正确率,满足一定场景的商用要求,但是带有口音标注的语音数据的短缺严重限制了口音英语识别相关研究的开展。

作为全球领先的人工智能数据服务服务商,数据堂已采集数十个国家和地区的口音英语数据集,能快速提高口音英语识别模型的识别精准度。

多国人口音英语数据集

中国人口音英语数据集
3000余名名中国人参与录制的10万句常用英语句子,覆盖国内江苏、山东、北京、河南等方言区,符合中国人说英语的特定口音。录音文本涵盖常用英语句子,内容丰富,领域广泛,音素均衡。可用于改善语音识别系统对中国人说英语的识别效果。

美式英语口音数据集
近2000余名美国母语发音人参与录制,口音正宗。录音文本由语言专家参与设计,以交互场景为导向,涵盖交互、车载、家居、通用等多类别,内容丰富。文本经过人工校对,准确率高。

英式英语口音数据集
由1651名英国本土发音人参与录制,口音正宗。录音文本涵盖通用、交互、车载、家居等多类别,内容丰富。文本经过人工校对,准确率高。

德国人口音英语数据集
1000余名德国人参与录制,口音正宗。录音文本由语言专家参与设计,涵盖通用、交互、车载、家居等多类别,内容丰富。文本经过人工校对,准确率高。匹配主流安卓、苹果系统手机。可用于语音识别、声纹识别模型训练、机器翻译语料库的建设或算法研究。

法国人口音英语数据集
1000余名法国人参与录制,音频内容包括通用、交互、车载、家居等多类别,内容丰富。覆盖18~60岁年龄段,在安静室内进行录制。可应用于语音识别、机器翻译等场景。

印度英语口音数据集
近2000余名印度本土发音人参与录制;录音文本由语言专家参与设计,涵盖通用、交互、车载、家居等多类别;文本经过人工校对,句准确率95%,可应用于语音识别、机器翻译、声纹识别。

数据堂已采集英国、美国、中国等数十个国家和地区的多国人口音英语数据,覆盖了各种发音特点、口音轻重,并完成对数据集的音标、重音标注、韵律标注,可以加强英文语种识别、口音语音识别的研究交流。


数据堂一直以最高标准要求自己,坚守并践行维护用户利益、保护数据安全、尊重用户隐私的承诺,已通过ISO27701、ISO27001隐私信息管理体系认证以及ISO9001质量管理体系认证,值得信赖。


如果以上数据不能满足您当前的需求,数据堂还可以针对特定人群、特定场景、特定语种提供相应的数据定制化服务,全力帮助客户得到满意的数据服务。

口音英语识别能力评测,你的AI升级了吗?相关推荐

  1. 构建口音英语识别数据,一招化解人机口音交流

    语音对于人机交互的重要性毋庸置疑,让机器"听懂"人类语言,是语音识别技术自诞生起,就致力于实现的目标. 英语是世界通用语言,国内外企业都在英语语音识别的速度.准确度等方面持续创新. ...

  2. 英语口语评测技术在学习产品中的设计应用

    语音评测技术又称口语评测技术.口语自动评估技术,通俗来说,就是利用计算机辅助语言学习(Computer Assisted Language Learning),是一种通过机器自动对发音进行评分.检错并 ...

  3. 红米note7html5测试,红米Note7上手体验评测 4800万AI双摄或为最大亮点

    红米Note 7值得买吗?除了低至999元的起售价外,6.3英寸的水滴全面屏也是红米Note 7手机的一大卖点.那么,针对入门级市场的红米Note 7究竟好不好?红米Note 7值得买吗?想入手该产品 ...

  4. php 讯飞语音评测_人工AI语音新高度:讯飞翻译机3.0测评体验

    科大讯飞在人工AI语音方面的地位都是毋庸置疑的,牛不牛就不多说了,说得高大上的东西离我们普通用户又太遥远,就说说离我们近的东西-语言,语言是人类交流的桥梁,生活中,工作中都离不开,但是每个地方有方言, ...

  5. 盛夏七月,一起见证AI升级新高度

    盛夏7月,产业智能化的浪潮正在加速AI产品与服务的更新迭代.新技术层出不穷,各种应用眼花缭乱,百度智能云的同学们也紧紧把握前沿技术脉搏,不断创新.这个七月,百度智能云又升级了哪些新技术呢?一起来看看这 ...

  6. 英语口语评测JAVA

    该篇主要讲腾讯口语评测,可以去腾讯云上查看官方文档:https://cloud.tencent.com/document/product/884/19309主要有两个步骤: 1.发音评估初始化 2.发 ...

  7. t420i升级固态硬盘提升_科赋CRAS C710 M.2固态硬盘评测:经典再升级

    熟悉存储的朋友可能都知道,近年来3D NAND技术的崛起,使得固态硬盘产品的存储容量实现翻倍,制造成本降低,大大加速了固态存储的普及.近日,笔者收到了来自韩国存储大厂科赋推出的.基于3D TLC NA ...

  8. 知乎、清华大学联合承办CCIR2018评测 寻找中国AI潜力股

    人工智能(AI)领域的快速发展,将对社会带来重大的影响,这引发了许多激烈的争论.一些人认为,它将驱动经济增长,为改善生活质量带来数不清的机会.尽管我们相信那些最深的恐惧其实是夸大其词的,但认知技术这一 ...

  9. 二代小米盒子评测:老用户升级意义不大

    在小米3手机和小米电视刚刚发布几天之后,新一代的小米盒子悄然登陆了小米官网,售价依旧为299元.与上一代产品相比,虽然全新的小米盒子在外观上并 没有发生任何改变,但硬件配置的提升还是多少让广大米粉们兴 ...

最新文章

  1. CentOS下Samba文件服务器的安装与配置
  2. 自定义StartIO
  3. logstash增量读取mysql中的数据到es中
  4. 论如何使用zabbix监控LNMP架构
  5. ORACLE 12c RAC的常用管理命令
  6. 20191202每日一句
  7. C# PDF转图片(JPG)
  8. word:清除格式(设置快捷键)
  9. TD幅度预测、幅度膨胀突破、TD通道
  10. 有人在开课吧学习过吗?值得信任吗?教学质量如何?
  11. 遇见未来 | 对话朱贤文,PostgreSQL是一匹即将发力的黑马
  12. 手把手教你用docker 搭建zoolkepper 和 dubbo 的测试环境
  13. #KINDLE 电子书制作指南 html转kf8/mobi
  14. 记一次个人服务器被nicehash挖矿,排查挖矿程序记录
  15. 服务器导购:选购服务器应看哪些配置参数
  16. 数组_二维数组的初始化方式
  17. 数学分析 曲面积分与场论初步(第22章)
  18. No SQL 数据库
  19. 基于canvas实现温度热力图,温度云图(一)--实现温度分布图
  20. 《人人都在说谎:赤裸裸的数据真相》读书笔记3

热门文章

  1. 计算图像数据集的均值和方差(mean, std)用于transforms.Normalize()标准化
  2. 《Migrating to Cloud-Native Application Architectures》学习笔记之Chapter 3. Migration Cookbook...
  3. 2022美亚杯第八届中国电子数据取证大赛-个人赛write up详解,软件就用弘连和美亚,尽量写的细致一点。建议入门看,仅为了解题,没有专业精神。专业选手去看后面推荐的两篇解析,都是大佬。
  4. HTML 基础- 4个实例
  5. Android Activity 启动模式详解
  6. p2p 文件服务器集群,基于云计算的P2P流媒体服务器集群部署算法.doc
  7. 计算机考证office四级
  8. 部署Kubernetes时出现ImagePullBackOff或ErrImagePull情况
  9. dobot moveit 包_DOBOT magician魔术师在ROS下使用moveit编写代码控制(笛卡尔空间控制走直线)...
  10. 桌面支持--PLM软件必须右键用管理员账号打开