大家好,上期小君给大家分享了语速对语音引擎识别的影响,相信大家对语速对识别的影响有了初步的认识。经过一个多月的调研,小君本期给各位带来了一次新的评测,即科大讯飞,百度,思必驰,云知声四家语音引擎在降噪性能上的差异。
本次评测主要是对比每家语音识别引擎降噪性能,采取将语音文件直接送接口的方式进行测试,接口同样是基于各家公司给广大语音开发爱好者提供的开源开发接口。
测试语音信息详情如下:
• 音频编码格式:wav
• 音频采样率:16000Hz
• 文本字数:每条平均8字左右,共计1586字。
• 音频分类:安静环境下音频、SNR=15环境下音频、SNR=5环境下音频(SNR为信噪比)
• 音频领域:手机基本操作,领域涉及有常用应用,导航,音乐,天气,设置,日期6个领域,共计200条
• 音频信息:北方自然语速,男女比例1:1,共计20人
• 噪音合成:采取噪音合成的方式对纯净音频进行加噪
• 噪音:中文歌曲

展示一下文本样例:

  1. 导航领域:请帮我绕开从王府井到西单的拥堵地段
  2. 设置领域:设置每周一早上7点的闹钟
  3. 手机基本操作领域:发短信给小明

由于本次测试采取的是直接将数据送入识别接口的方式进行,没有类似于终端产品对整个环境的收音模块,所以噪音不能直接以播放的方式进行增加,但咱们还得测试不同信噪比下的数据呢,难不倒小君的,小君有噪音合成工具!可以将选定的噪音数据与语音数据进行,且SNR可设定,问题解决,而且还能更好的保证噪音数据一致性!
语音识别引擎在噪音消除方面的性能好坏会基于产品的定位,对不同的噪音也会有不同的处理方式,本次小君选取噪音集为常用噪音集,中文歌曲;由于本次测试专注于降噪算法的对比,为了减少变量、保证数据一致性,选取的语音数据为消音室录制的语料。

测试数据的信息大家了解的差不多了,那让我们来看一下对比结果,来分析各引擎的优缺点吧。
首先我们通过识别引擎在不同噪音环境下进行识别率的对比,通过下图数据可以看出科大讯飞和思必驰在三种环境下识别率差异不大,识别率从安静环境到SNR=5环境下降了1%左右,表现较好。百度在安静条件的语音识别率达到了97.51%,SNR=15时识别率为96.35%,SNR=5时降到了81.26%,可以看出随着噪音声压级的增大,百度识别引擎的降噪算法性能出现了大幅度的下降;云之声则时安静条件到SNR=15时下降幅度较大,从94.41%下降到了89.78%。SNR=15到SNR=5时的识别率下降幅度较小。

然后再对四款语音识别引擎间进行识别率的对比,可以看出安静条件下,云之声较其他三款产品的识别率最低,识别率为94.41%;SNR=15时,科大讯飞和思必驰表现较好,云之声相对较差,识别率为89.78%;随着背景噪音声压级的增大,在SNR=5时,百度识别率下降幅度较大,下降到81.26%,云之声同样较差,识别率为87.33%。测试详细数据如下:


(备注:以上测评结果仅基于本次验证集)

综合以上两方面的对比,基于本次测试数据的测试结果可以看出,科大讯飞和思必驰在降噪处理方面综合表现较好,百度和云之声在该方面则表现较差。
另外小君在本次测试过程中发现一个有趣的现象,思必驰识别引擎在安静条件下要比SNR=15时的识别率要低0.19%。为了搞清楚这0.19%的差距在哪,小君将两组测试结果分别对比,发现差异并不大,仅有6条语音的识别结果存在差异,主要体现在安静条件下的替换错误增加,而SNR=15条件下插入错误增加,下面列举一下部分识别结果供大家参考。

本次小君仅从中文音乐噪音的消除性能方面对四款公开的识别引擎进行了对比,不作为评价四款识别引擎降噪性能好坏的评价标准。因为仅仅是音乐噪音又区分了不同的语言、高中低频等,如果您想了解识别引擎的整体降噪性能,需要多个维度进行测评,对语音识别引擎降噪算法的测试感兴趣的话,可以随时联系小君,小君表示热烈欢迎。

科大讯飞,百度,思必驰,云知声四款识别引擎降噪算法性能对比相关推荐

  1. AWE2018观察:智能电视成黑马,思必驰获双料大奖

    2018年3月8日至3月11日,AWE2018中国家电及消费电子博览会在上海举行.作为全球三大家电及消费电子展会之一,本届AWE2018吸引了800余家国内外知名企业参展,展示了家用电器.消费电子.智 ...

  2. 思必驰回复第二轮审核问询,如何与科大讯飞、阿里巴巴“虎口夺食”?

    ‍数据智能产业创新服务媒体 --聚焦数智 · 改变商业 3月21日,思必驰科技股份有限公司(以下简称"思必驰")更新上市申请审核动态,已回复上交所第二轮审核问询函,回复了涵盖关于实 ...

  3. 小程序--语音合成tts 对接多平台(讯飞,思必驰,百度)

    小程序功能特点 文本转语音 多平台多发音人可选 可调语速 可提供音频下载 良心产品无广告? 小程序码 已对接在线语音识别服务 思必驰dui平台 (超过40个免费可选发音人) 讯飞开放平台 (5个免费可 ...

  4. 思必驰刚折戟上交所,出门问问冲刺港交所能成功么?

    ‍数据智能产业创新服务媒体 --聚焦数智 · 改变商业 2023年5月30日,AI独角兽公司出门问问(Mobvoi Inc.)向港交所递交招股书,拟在香港主板挂牌上市,中金公司和招银国际为联席保荐人. ...

  5. 牵手思必驰,博泰车联网要打造一个通用的车载语音平台

    *上海博泰创始人兼董事长应宜伦&思必驰董事长兼 CEO 高始兴 语音交互已经成为车载交互方式革命的一项重要成果,如今只要是敢称自己为智能汽车的车型,其上必定配备了语音识别.语音控制的功能.不得 ...

  6. 牵手思必驰,博泰车联网要打造一个通用的车载语音平台...

    *上海博泰创始人兼董事长应宜伦&思必驰董事长兼 CEO 高始兴 语音交互已经成为车载交互方式革命的一项重要成果,如今只要是敢称自己为智能汽车的车型,其上必定配备了语音识别.语音控制的功能.不得 ...

  7. 思必驰携手博泰,共创智能汽车新声代

    思必驰必将为用户努力提供拥有更加极致丰富的智能体验的语音交互产品,与博泰共同打造汽车智能语音新声代. 据数据显示,到2023年之前智能车载的渗透率将会超过50%.同时,智能语音交互也必然会汽车的标准配 ...

  8. 思必驰AI芯片发布:内置完整语音交互方案,支持离线模式,All in One

    李根 发自 凹非寺  量子位 报道 | 公众号 QbitAI AI独角兽思必驰,如何自我评价2018? 他们决定拿产品来说话. 而最重要的产品,便是正式发布上市的AI语音芯片:深聪TAIHANG芯片( ...

  9. 【智能家居】设计一种语音控制识别规则模型---结合思必驰DUI平台

    目录 智能家具语音识别应用场景 控制音乐播放 结合思必驰DUI平台 智能家居设备控制 设备控制 场景控制 DUI平台智能家居技能解析 设计一个简单的语音控制流程 语音匹配规则模型 语音识别处理流程 优 ...

  10. 思必驰发布AI芯片,透视智能语音企业的商业化历程

    2019 年 1 月 4 日,言由芯生--2019 年思必驰 AI 芯片暨战略发布会在京举行. 现场,AI 芯片作为重头戏展示了其低功耗.高性能的核心优势,同时,思必驰多视角解读了 2018 年所取成 ...

最新文章

  1. 【译】Linux概念架构的理解
  2. python3 清除asyncio队列 方法
  3. 二本非科班30岁转行架构师的老徐:站在巨人的肩膀学习才是捷径
  4. 安装步骤_仓库货架的安装步骤
  5. 快速构建Windows 8风格应用25-数据绑定
  6. Kafka创建topic报错:Error: Exception thrown by the agent : java.rmi.server.ExportException: Port already
  7. 阿里P9专家右军:以终为始的架构设计
  8. 对人工智能芯片的一些看法
  9. Windows10共享CentOS文件系统(Samba的使用)
  10. pytorch学习之线性拟合
  11. 房屋管理小程序的功能
  12. [CODE【VS】]江哥的DP题d
  13. 深度学习常用的数据集,包括各种数据跟图像数据。
  14. Go 中 Gzip 与 json 搭配使用压缩数据,减少数据传输量
  15. python 保存和读取中间变量
  16. 树莓派更改python镜像源
  17. 区块链知识系列 - PBFT 共识
  18. 前端学习网络资源链接汇总
  19. 好用的Chrome插件推荐
  20. 金融学知识-(front-running)

热门文章

  1. 中国高校IPv6升级成果初显,城市热点助力高校加快IPv6部署进程
  2. 在 GitHub 上玩转开源项目的 Code Review
  3. web学生网页设计作业源码——国际足联世界杯(HTML+CSS)
  4. Unity 实现批量Build打包
  5. LTE附着流程详解-UECapabilityInformation
  6. 工作流引擎——构建企业流程管控体系
  7. 微信注册AppID失败
  8. 解决谷歌浏览器被篡改主页问题
  9. 硬盘数据恢复入门教程[三]----逻辑盘BPB表篇
  10. pyspark groupby 后将遍历的每一行转成pandas df