语音控制的基础就是语音识别技术,可以是特定人或者非特定人的。非特定人的应用更为广泛,对于用户而言不用训练,因此也更加方便。语音识别可以分为孤立词识别,连接词识别,以及大词汇量的连续词识别。对于智能机器人这类嵌入式应用而言,语音可以提供直接可靠的交互方式,语音识别技术的应用价值也就不言而喻。

一、 语音识别概述
语音识别技术最早可以追溯到20世纪50年代,是试图使机器能“听懂”人类语音的技术。按照目前主流的研究方法,连续语音识别和孤立词语音识别采用的声学模型一般不同。孤立词语音识别一般采用DTW动态时间规整算法。连续语音识别一般采用HMM模型或者HMM与人工神经网络ANN相结合。

语音的能量来源于正常呼气时肺部呼出的稳定气流,喉部的声带既是阀门,又是振动部件。语音信号可以看作是一个时间序列,可以由隐马尔可夫模型(HMM)进行表征。语音信号经过数字化及滤噪处理之后,进行端点检测得到语音段。对语音段数据进行特征提取,语音信号就被转换成为了一个向量序列,作为观察值。在训练过程中,观察值用于估计HMM的参数。这些参数包括观察值的概率密度函数,及其对应的状态,状态转移概率等。当参数估计完成后,估计出的参数即用于识别。此时经过特征提取后的观察值作为测试数据进行识别,由此进行识别准确率的结果统计。训练及识别的结构框图如图1所示。

图1 语音识别系统结构框图
1、 端点检测
找到语音信号的起止点,从而减小语音信号处理过程中的计算量,是语音识别过程中一个基本而且重要的问题。端点作为语音分割的重要特征,其准确性在很大程度上影响系统识别的性能。

能零积定义:一帧时间范围内的信号能量与该段时间内信号过零率的乘积。
能零积门限检测算法可以在不丢失语音信息的情况下,对语音进行准确的端点检测,经过450个孤立词(数字“0~9”)测试准确率为98%以上,经该方法进行语音分割后的语音,在进入识别模块时识别正确率达95%。

图2 检测结果的效果示意图
当话者带有呼吸噪声,或周围环境出现持续时间较短能量较高的噪声,或者持续时间长而能量较弱的噪声时,能零积门限检测算法就不能对这些噪声进行滤除,进而被判作语音进入识别模块,导致误识。图2(a)所示为室内环境,正常情况下采集到的带有呼气噪声的数字“0~9”的语音信号,利用能零积门限检测算法得到的效果示意图。最前面一段信号为呼气噪声,之后为数字“0~9”的语音。

从图2(a)直观的显示出能零积算法在对付能量较弱,但持续时间长的噪音无能为力。由此引出了双门限能零积检测算法。
所谓的双门限能零积算法指的是进行两次门限判断。第一门限采用能零积,第二门限为单词能零积平均值。也即在前面介绍的能零积检测算法的基础上再进行一次能零积平均值的判决。其中,第二门限的设定依据取决于所有实验样本中呼气噪声的平均能零积及最小的语音单词能零积之间的一个常数。如图2(b)所示,即为图2(a)中所示的语音文件经过双门限能零积检测算法得到的检测结果。可以明显看到,最前一段信号,即呼气噪声已经被视为噪音滤除。

机器人识别软件框图
机器人由自然条件下的语句进行控制。这些语句描述了动作的方向,以及动作的幅度。为了简单起见,让机器人只执行简单命令。由手机进行遥控,DSP模块识别出语音命令,送控制命令到ARM模块,驱动左右机械轮执行相应动作。

机器人主要有2大模块,一个是基于DSP的语音识别模块;另一个是基于ARM的控制模块,其机械足为两滑轮。由语音识别模块识别语音,由控制模块控制机器人动作。

2、 语音控制
首先根据需要,设置了如下几个简单命令:前、后、左、右。机器人各状态之间的转移关系如图5所示。其中,等待状态为默认状态,当每次执行前后或左右转命令后停止,即回到等待状态,此时为静止状态。

机器人状态
命令代表动作的方向,数字代表动作的幅度。当执行前后命令时,数字的单位为dm,执行左右转弯命令时,数字的单位为角度单位的20°。每句命令句法为命令+数字。

ai智能电话机器人语音识别技术相关推荐

  1. ai智能电话机器人小白使用搭建

    AI智能电话机器人从0开始源码搭建揭秘! 随着人工智能的普及,AI已经渗透到各行各业,本文就为大家介绍了利用最前沿的AI技术实现电话机器人的原理.智能电话机器人就是充分的利用了人工智能语音识别技术和大 ...

  2. AI智能电话机器人小白使用搭建教程

    AI智能电话机器人从0开始源码搭建揭秘! 随着人工智能的普及,AI已经渗透到各行各业,本文就为大家介绍了利用最前沿的AI技术实现电话机器人的原理.智能电话机器人就是充分的利用了人工智能语音识别技术和大 ...

  3. 人工ai智能电话机器人应用市场分析

    在人工智能出现之后,似乎人类就失去了优势. 比如在美国,使用IBM的Watson电脑软件,就有90%的准确性对案件作出预判,比起只有70%准确性的人为律师,既简捷又便宜.如今,随着人工智能的发展或有很 ...

  4. ai智能电话机器人在我们的生活中扮演什么角色

    人工智能是顺应时代发展的产物,它是通过人类的技术再结合人类的需求而出现在人类的生活和工作中的助手.那么它的效果究竟怎样?到底值不值得被应用呢? 顾名思义,人工智能电话机器人就是能够在电话类型的工作中帮 ...

  5. AI引领,语音识别技术有怎样的发展趋势?

    语音识别是人工智能领域的一个重要方向,现在已逐渐发展为一个具有广阔前景的高新技术产业,许多企业在语音识别技术上潜精研思.例如,百度借助自己的人工智能生态平台,推出了智能行车助手CoDriver:科大讯 ...

  6. ai智能电话机器人是电销的好帮手

    智能电话机器人的发展,速度之快超出了很多人的想象.疫情之前,还有不少人认为,智能电话机器人是个鸡肋的存在.而当初的鸡肋产品,现如今却成了各种企业争相追捧的营销利器. 先说一个小插曲,在疫情期间美团用智 ...

  7. 人工电销时代,你来不来 ,ai智能电话机器人

    当前,世界正掀起新一轮的科技革命和产业革命,在物联网.云计算.大数据.认知学等科技的深度融合和推动下,机器人不断形成新的发展形态,智能化的发展方向日益凸显.当然电销行业也不例外,智能电销机器人的出现, ...

  8. ai智能电话机器人如何

    随着时间的推移,人工智能的发展越来越成熟,智能时代也离人们越来越近,近几年人工智能越来越火爆,人工智能的应用已经开始渗透到各行各业,与生活交融,成为人们无法拒绝,无法失去的一个重要存在. 对于销售型企 ...

  9. AI智能电话机器人错误码大全解析

    CALL_REJECTED 呼叫被拒绝, 正常 USER_BUSY 用户占线繁忙, 正常 NO_ANSWER 呼叫未应答, 正常 NORMAL_RELEASE 正常释放 NORMAL_CLEARING ...

最新文章

  1. WEB攻击手段及防御第2篇-SQL注入
  2. javascript 自动按按钮
  3. Luogu P4859「已经没有什么好害怕的了」
  4. 团队项目个人进展——Day05
  5. ​赠书:面向对象的两大迷思,再给你们解答一次
  6. 软件测试学习笔记:找代码中的fault,并设计特定的测试用例
  7. Animated Eye Candy for Programmers
  8. java数据结构实验一顺序表,java数据结构实验代码之升序顺序表
  9. Java基础提升高级API
  10. TCP and UDP
  11. 灵异:各国家千年诅咒悬迷——不可思议
  12. oracle 复杂判断,单条SQL语句实现复杂逻辑几例~~
  13. 安装brat的jquery错误
  14. arccatalog点要素显示不完_shp文件转为dwg之后在arcgis下打开属性表有高程信息但在cad里面打开为何没高程 - 地学 - 小木虫 - 学术 科研 互动社区...
  15. 【翻译】MED 3D: TRANSFER LEARNING FOR 3D MEDICAL I MAGE ANALYSIS
  16. excel 替换 换行符_在Excel中查找和替换换行符
  17. uniapp 中 通过经纬度获取地址详情(vue)
  18. python决策树案例_决策树案例:基于python的商品购买能力预测系统
  19. 计算机教室英语怎么读音,电脑教室,computer teaching room,音标,读音,翻译,英文例句,英语词典...
  20. 音频转换通项目案例简单过程分享

热门文章

  1. 硬链接、软链接、ln命令
  2. 【机器学习算法】神经网络和深度学习-4 重要的BP网络使用总结,了解BP神经网络的魅力
  3. 利用OpenGL设计贪吃蛇游戏
  4. jmeter压力测试报告
  5. python 日期格式只取年月_python如何只获取日期
  6. ps里面怎么插入流程图_用PS怎么画流程图?
  7. xml开发笔记(一):tinyXml2库介绍、编译和工程模板
  8. QList(增删改查)示例
  9. 搭建Vue3 后台管理框架 —— 登录页面
  10. 免费视频格式转换软件,6大免费视频转换器推荐