语音识别技术,也被称为自动语音识别(ASR),其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。与说话人识别及说话人确认不同,后者尝试识别或确认发出语音的说话人而非其中所包含的词汇内容。

语音识别技术的应用包括语音拨号、语音导航、室内设备控制、语音文档检索、简单的听写数据录入等。语音识别技术与其他自然语言处理技术如机器翻译及语音合成技术相结合,可以构建出更加复杂的应用,例如语音到语音的翻译。

语音识别技术所涉及的领域包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。

在电话与通信系统中,智能语音已经实现了运用在商用落地,比如智能电话机器人,智能外呼系统,智能电话客服系统等,让人们可以通过语音命令方便地从远端的数据库系统中查询与提取有关的信息;随着计算机的小型化,键盘已经成为移动平台的一个很大障碍,想象一下如果手机仅仅只有一个手表那么大,再用键盘进行拨号操作已经是不可能的。语音识别正逐步成为信息技术中人机接口的关键技术,语音识别技术与语音合成技术结合使人们能够甩掉键盘,通过语音命令进行操作。语音技术的应用已经成为一个具有竞争性的新兴高技术产业。

语音识别技术发展到今天,特别是中小词汇量非特定人语音识别系统识别精度已经大于98%,对特定人语音识别系统的识别精度就更高。这些技术已经能够满足通常应用的要求。由于大规模集成电路技术的发展,这些复杂的语音识别系统也已经完全可以制成专用芯片,大量生产。在西方经济发达国家,大量的语音识别产品已经进入市场和服务领域。一些用户交机、电话机、手机已经包含了语音识别拨号功能,还有语音记事本、语音智能玩具等产品也包括语音识别与语音合成功能。人们可以通过电话网络用语音识别口语对话系统查询有关的机票、旅游、银行信息,并且取得很好的结果。调查统计表明多达85%以上的人对语音识别的信息查询服务系统的性能表示满意。

当然,可以预测在近五到十年内语音识别系统的应用将更加广泛。各种各样的语音识别系统产品将出现在市场上。人们也将调整自己的说话方式以适应各种各样的识别系统。在短期内还不可能造出具有和人相比拟的语音识别系统,要建成这样一个系统仍然是人类面临的一个大的挑战,我们只能一步步朝着改进语音识别系统的方向一步步地前进。至于什么时候可以建立一个像人一样完善的语音识别系统则是很难预测的。就像在60年代,谁又能预测今天超大规模集成电路技术会对我们的社会产生这么大的影响。

电话机器人核心技术之ASR(自动语音识别)相关推荐

  1. html语音转asr,呼叫中心ASR自动语音识别详解

    ASR即自动语音识别.此项技术的目标是让计算机能够"听写"出不同人所说出的连续语音,也就是俗称的"语音听写机",是实现"声音"到" ...

  2. ASR自动语音识别基础理论

    基础理论 对话式AI的理解与其子任务的介绍 ASR自动语音识别 简史和发展历程 工作流程及原理 ASR自动语音识别简介 ASR自动语音识别应用场景 ASR自动语音识别理论 自动语音识别工具包的简介及设 ...

  3. 智能电话机器人核心技术:ASR

    随着人工智能科技的发展,市场上也出现了越来越多的应用,光是人工智能语音识别系列的产品就非常多了,例如电话机器人.早教机器人.智能音响等等.其中大部分应用产品都是陪伴或者娱乐性质为主,而智能电话机器人是 ...

  4. html语音转asr,自动语音识别(ASR)在呼叫中心系统中的应用

    自动语音识别(ASR)在呼叫中心系统中的应用 自动语音识别(AutomaticSpeechRecognition简称"ASR")技术的目标是让计算机能够"听写" ...

  5. ASR自动语音识别技术

    自动语音识别技术(Automatic Speech Recognition)是一种将人的语音转换为文本的技术.语音识别是一个多学科交叉的领域,它与声学.语音学.语言学.数字信号处理理论.信息论.计算机 ...

  6. NVIDIA Riva中文手册 (四) —— Riva ASR自动语音识别API的使用

    如何通过Riva ASR API 与开箱即用的语音识别模型一起使用? 本节将引导您了解 Riva Speech Skills ASR 服务的基础知识,特别介绍如何将 Riva ASR API 与开箱即 ...

  7. ASR自动语音识别代码操作

    JupyterLab 语音识别操作流程 录制语音文件 合并为单声道文件 导入nemo工具包及asr工具类 加载Quartznet中文版预训练模型 测试模型识别效果 语音识别操作流程 使用音频软件或手机 ...

  8. 电话机器人核心技术之NLP

    什么是NLP NLP是神经语言程序学 (Neuro-Linguistic Programming) 的英文缩写; NLP译为"身心语法程式学"或"神经语言程序学" ...

  9. 对于谷歌应用传统的自动语音识别(ASR)系统的解析

    目前,谷歌的各种语音搜索应用还在使用传统的自动语音识别(ASR)系统,它包括一个包括声学模型(AM ).一个发音模型(PM)和一个语言模型(LM),它们都是彼此独立训练的,而且需要研究人员在不同数据集 ...

最新文章

  1. WF4.0实战(一):文件审批流程
  2. 后台报错 新导入的项目报错
  3. 【RecyclerView】 七、RecyclerView.ItemDecoration 条目装饰 ( getItemOffsets 边距设置 )
  4. 用cookie实现保存密码
  5. 【计算机视觉】OpenCV的最近邻开源库FLANN
  6. 在Teams app代码中enable nullable
  7. repadmin查看域控之间的复制状态
  8. Python | 使用__del __()和__init __()实现析构函数和构造函数的示例
  9. MITK医学Python开发入门详细版
  10. std list/vector sort 自定义类的排序就是这么简单
  11. Microsoft Windows XP Embedded 技术常见问题
  12. linux 检查zip是否损坏,用-v参数 unzip -v test.zip 检查zip文件是否损坏代常亮
  13. oracle收款凭证做错月份,上个月的银行凭证做错了怎么办
  14. org.springframework.data.mapping.PropertyReferenceException: No property item found for type BItem!
  15. 睿联技术在创业板过会:收入依赖摄像机单机,计划募资11亿元
  16. VC++ 屏幕捕获(DirectDraw)
  17. 游戏2048源代码 - C语言控制台界面版
  18. Matlab代理模型工具箱汇总及下载
  19. Linux从入门到放弃
  20. 【无人驾驶三】基于计算机视觉的无人驾驶感知系统

热门文章

  1. 使用protoc 命令后编译生成的java代码有报错的解决方法
  2. Hive 报错提示及解决方法
  3. 樱桃键盘Ubuntu(Linux系统)卡顿延迟解决方案
  4. 如果不用为生活奔波,我愿意成为一个自由作家
  5. 9000字通俗易懂的讲解下Java注解,你还看不明白?,linux操作系统基础与应用答案
  6. 产品在设计上,如何为用户创造惊喜
  7. php餐厅预定座位系统,一种餐厅座位智能化预订系统的制作方法
  8. linux同步bios时间指令,Shell实现系统时间和BIOS时间同步校准脚本分享
  9. 基金投资好简单,从入门到精通 -学习笔记day11
  10. html 、css、js动态文字时钟