语音识别技术(Automatic Speech Recognition, ASR)是计算机听觉领域中重要的研究方向之一。其目标是就是让机器把语音信号转变为相应的文本,进而达到机器自动识别和理解语音内容。语音识别作为一种基础层感知类技术,既可以作为核心技术直接应用于终端产品,也可以仅作为一种感知类辅助技术集成于语音助手、车载系统、智慧医疗、智慧法院等场景的产品中。
—语音识别系统原理—

目前语音识别的技术成熟度已经有了较大的提升,但还无法达到100%的准确度。其主要瓶颈在于语音交互受背景噪音、语速等多重因素影响,不同场景识别率差别较大;语音识别缺乏通过上下文来纠正文字的能力;语义不全等。尽管现在顶级的语音识别系统正确率普遍超过95%,即每20个字错一个字。但是这些错字有可能是关键字错误,比如说少了一个“不”字。这类错误会导致语义产生严重变化。此外,还有如何解决方言口音和语音系统快速迁移等都是语音识别工程中需要考虑的问题。

目前现有的语音系统对于这些问题缺少很好的解决手段,解决这个问题既需要改善算法本身,也需要大量的有效的数据进行算法训练,从而使算法达到一定的成熟度。

朗读类语音数据

普通话
1505小时普通话手机采集语音数据
849小时普通话家居交互手机语音数据
662小时中文重口音手机采集语音数据
132小时中文重口音手机采集语音数据
1026小时中文重口音手机采集语音数据
203人噪音环境口音普通话手机采集语音数据_朗读

方言:
1044小时闽南语手机采集语音数据
1652小时粤语手机采集语音数据
1032小时上海方言手机采集语音数据
250人苏州方言手机语音采集数据
400人杭州方言手机语音采集数据
1000小时长沙方言手机采集语音数据
794小时四川方言手机采集语音数据
1000小时武汉方言手机采集语音数据
1000小时昆明方言手机采集语音数据
312人东北方言手机采集语音数据
463人河南方言手机采集语音数据
738小时维语手机采集语音数据
1000小时藏语手机采集语音数据
204人台湾普通话手机采集语音数据_朗读

英语:
201小时北美英语手机采集语音数据
215小时美式英语手机采集语音数据_朗读
800小时美式英语手机采集语音数据_交互场景
199小时英式英语手机采集语音数据_朗读
800小时英式英语手机采集语音数据
1000小时印度英语手机采集语音数据
593小时中国人说英语手机采集语音数据
500小时中国人说英语手机采集语音数据
500小时西班牙人说英语手机采集语音数据
520小时法国人说英语手机采集语音数据
535小时德国人说英语手机采集语音数据
200小时意大利人说英语手机采集语音数据
200小时葡萄牙人说英语手机采集语音数据
200小时拉丁美洲人说英语手机采集语音数据
500小时日本人说英语手机采集语音数据
500小时韩国人说英语手机采集语音数据
500小时俄罗斯人说英语手机采集语音数据
200小时巴西人说英语手机采集语音数据
500小时澳大利亚英语手机采集语音数据
500小时加拿大英语手机采集语音数据
300小时新加坡英语手机采集语音数据
200小时马来西亚英语手机采集语音数据

欧洲语系:
211小时德语手机采集数据_朗读
1800小时德语手机采集语音数据
215小时意大利语手机采集语音数据_朗读
347小时意大利语手机采集语音数据
1440小时意大利语手机采集语音数据
232小时法语手机采集语音数据_朗读
768小时法语手机采集语音数据
227小时西班牙语手机采集语音数据_朗读
338小时西班牙语手机采集语音数据
435小时西班牙西班牙语手机采集语音数据
780小时墨西哥哥伦比亚西班牙语手机采集语音
1000小时欧洲葡萄牙语手机采集语音数据
800小时俄语手机采集语音数据

亚洲语系:
241小时印地语手机采集语音数据_朗读
824小时印地语手机采集语音数据
235小时日语手机采集语音数据
265小时日语手机采集语音数据
514小时日语手机采集语音数据
197小时韩语手机采集语音数据_朗读
357小时韩语手机采集语音数据
500小时韩语手机采集语音数据
292小时泰语手机采集数据_朗读
360小时印尼语手机采集语音数据_朗读
640小时印尼语手机采集语音数据
156人马来西亚语手机采集数据_朗读
365小时马来语手机采集语音数据
500小时越南语手机采集语音数据

美洲语系:
1000小时巴西葡萄牙语手机采集语音数据

如何提升语音识别技术的识别能力?相关推荐

  1. 语音识别技术在汽车上的应用

    苹果和谷歌这两大国际IT巨头的战略表明,在智能手机上广泛应用的语音识别技术很快会在汽车上普及.本文以宝马.本田和福特等几个典型汽车厂商的案例介绍语音识别在汽车上的应用,并展望未来发展趋势. 苹果公司i ...

  2. HarmonyOS之AI能力·语音识别技术

    一.基本概念 语音识别功能提供面向移动终端的语音识别能力.它基于华为智慧引擎(HUAWEI HiAI Engine)中的语音识别引擎,向开发者提供人工智能应用层 API.该技术可以将语音文件.实时语音 ...

  3. 景联文科技:为自动驾驶车载语音识别技术提供全方面的数据支持

    随着车联网和智能汽车的兴起,越来越多的功能被搭载在汽车上.随着语音识别技术在智能车载领域落地应用越来越成熟,更多司机解放了双手,通过简单的语音指令就可以进行导航.听音乐.控制车窗和空调等设备. 在前不 ...

  4. 中文语音识别引擎,盘点中国语音识别技术公司排名

    计算机视觉(CV)是AI领域一大吸金赛道,也由此产生了商汤.云从.依图.旷视这样的"图像四小龙".而这四小龙之一的「依图科技」却率先拓宽边界,踏入语音和自然语言处理(NLP)行业. ...

  5. 从不温不火到炙手可热:语音识别技术简史

    作者 | 陈孝良,冯大航,李智勇 出品 | AI科技大本营(ID: rgznai100) [导读]语音识别自半个世纪前诞生以来,一直处于不温不火的状态,直到 2009 年深度学习技术的长足发展才使得语 ...

  6. 马志强:语音识别技术研究进展和应用落地分享丨RTC Dev Meetup

    本文内容源自「RTC Dev Meetup 丨语音处理在实时互动领域的技术实践和应用]的演讲分享,分享讲师为寰语科技语音识别研究主管马志强. 01 语音识别技术现状 1.语音成为万物互联时代人机交互关 ...

  7. 百度语音识别技术负责人李先刚:如何利用Deep CNN大幅提升识别准确率?

     百度语音识别技术负责人李先刚:如何利用Deep CNN大幅提升识别准确率? 机器之心mp 2016-11-04 14:24:34 技术 百度 阅读(440) 评论(0) 机器之心原创 作者:赵云 ...

  8. lms自适应滤波器实现噪声干扰的语音恢复_ZLG深度解析语音识别技术

    语音识别已成为人与机器通过自然语言交互重要方式之一,本文将从语音识别的原理以及语音识别算法的角度出发为大家介绍语音识别的方案及详细设计过程. 语言作为人类的一种基本交流方式,在数千年历史中得到持续传承 ...

  9. 第五十期:详解语音识别技术的发展

    在我们的生活中交流起着重要的作用.人类从符号开始,然后发展到用语言交流,再后来出现了计算和通信技术.在某些情况下,机器不仅与人类交流,也与机器之间交流.计算机和通信技术创造了互联网世界,正如我们所知的 ...

最新文章

  1. EF-Net一种适用于双流SOD的有效检测模型(Pattern Recognition)
  2. HTML(二):表格元素
  3. 修改windows远程登录端口
  4. 基于Django进行简单的微信开发
  5. 起售价仅7699元!全新折叠旗舰OPPO Find N发布
  6. 01 springboot 2入门之hello springboot 2(maven构建springboot)
  7. 量子计算机原理 不确定,【图片】不确定性原理对量子纠缠的解释【经典物理吧】_百度贴吧...
  8. 巃嵸鸿蒙构瑰材兮,明堂赋原文、翻译及赏析_李白古诗_风萧学古网
  9. GO 语言学习资源整理
  10. 注塑工艺要考虑的7个因素,快转发收藏啦!
  11. whistle抓包工具
  12. EXCEL内容很少文件却很大---如何变小
  13. 【C++】阶段性学习总结(一)
  14. Spark 基础知识
  15. 三线制电阻内引线阻值测量
  16. 】20款优秀的移动产品原型和线框图设计工具
  17. android游戏出现闪退问题怎么解决方法,游戏出现频繁闪退解决方法参考 游戏频繁闪退怎么办...
  18. datetime格式提取年月日
  19. Deepin Linux系统怎安装打印机? 兄弟1618w打印机驱动安装图文教程
  20. 通过Webkit远程调试协议监听网页崩溃

热门文章

  1. PHP微信固码免签系统源码+带监控APP和教程
  2. 【航拍干货】航测区域重点建筑物精细化建模航拍技巧
  3. android 高德拖拽地图定位,拖拽选址-拖拽选址-示例中心-JS API UI 组件示例 | 高德地图API...
  4. 不要让自己的大脑变成别人思想的跑马场-叔本华
  5. PAT甲级1012:The Best Rank (25)
  6. H3C新华三链路聚合介绍
  7. 简要分析网络三层架构(核心层、汇聚层、接入层)
  8. python mysql版本查看_怎么查看mysql版本
  9. unity中3D数学相关类、属性、方法、用途总结+超级综合的案例
  10. Navicat 中mysql查询使用占位符