一般智能语音助理或语音机器人工作原理大致如下:

第一阶段:
语音到文本的过程。信号源→设备(捕获音频输入)→增强音频输入→检测语音→转换为其他形式(如文本)

第二阶段:
响应过程。处理文本(如用NLP处理文本,识别意图)→操作响应。

在检测语音过程中,就包括分辨是否为语音信号,该过程会通过指定的频率对模拟信号进行采样,将模拟声波转换为数字数据。这一过程很重要,是否成功地识别语音。如果生成数字数据都是错误的,那么后期的处理响应那肯定是错的。这也是影响智能语音助理或语音机器人识别率的重要因素。

在这个过程,用于语音处理的技术是语音活性检测 (Voice activity detection,VAD),目的是检测语音信号是否存在。 VAD技术主要用于语音编码和语音识别。它可以简化语音处理,也可用于在音频会话期间去除非语音片段:可以在IP电话应用中避免对静音数据包的编码和传输,节省计算时间和带宽。

文本将与大家分享VAD技术,首先讲两个概念:
信噪比(缩写为SNR或S / N)是科学和工程中使用的一种度量,它将所需信号的电平与背景噪声电平进行比较。
SNR定义为信号功率与噪声功率之比,通常以分贝表示。比率高于1:1(大于0 dB)表示信号多于噪声。
窗口,研究信号源,我们将其分成滑动窗口或仅窗口。

编辑

能量检测器

能量检测器对于高SNR信号是有效的,但是当SNR下降直到它在1以下变得无效时失去效率。它也不能将语音与诸如冲击噪声(将笔放在桌子上),打字,空调或任何噪声之类的噪声区分开来。比人声更响亮或更响亮。

波形和频谱分析

在波形和频谱分析中,语音活动检测利用语音的已知特征。在该方法中应用VAD比基于能量的解决方案更加计算密集,但是能够更好地检测非平稳噪声和低SNR场景中的噪声。

对于浊音音素,声带的振动产生谐波丰富的声音,具有50到250 Hz之间的明显音调。所有元音,但也有一些辅音,表现出这种谐波结构,因此是语音的特征。代表谐波结构的特征是语音的可靠指标。然而,单独使用基于谐度或基于音调的特征不能预期无声语音部分(例如一些摩擦音)被检测到。此外,音乐或其他谐波噪声分量可能被误解为语音。

总的来说,对信号的倒谱的分析可以揭示信号能量的来源。

同样的,基于该共振峰结构,也是语音识别系统的重要特征。人类声道中的可变腔允许扬声器形成不同的音素。强调谐振(或共振峰)频率,导致频谱包络的特征形状。

平滑很重要,在一个对话中,一个人只有50%的时间在说话,并且存在大量非活动帧。诸如[p] [t] [k] [b]之类的音是静音,并且静音部分可能不会被算法识别为语音,这将影响自动语音识别系统的性能。

解决方案如下:

要被视为语音,必须至少有3个连续的窗口标记语音(192ms)。它可以防止短暂的噪音被视为语音。

要被认为是沉默,必须至少连续3个窗口标记为静音。它可以防止过多的语音切入影响语音节奏。

如果窗口被认为是语音,则前3个窗口和3个窗口被认为是语音。它可以防止在句子开头和结尾丢失信息。

基于统计分析

MFCC,FBANK,PLP是最常用的语音识别功能。有数学运算的连接,旨在通过保持最相关的数据来减少和压缩信息的数量。

在“信号源→设备(捕获音频输入)→增强音频输入→检测语音”过程中,语音成功采样识别为数字数据,是后期语言处理的前提,在检测中文面临更大挑战,断句、语气、语调等因素直接影响识别率。

因此,语音活性检测会影响电话机器人的识别率。

AI智能电话销售机器人源码搭建部署系统电话机器人源码相关推荐

  1. AI智能电话销售机器人源码搭建部署系统电话机器人源码,电话机器人噪音处理

    一般智能语音助理或语音机器人工作原理大致如下: 第一阶段: 语音到文本的过程.信号源→设备(捕获音频输入)→增强音频输入→检测语音→转换为其他形式(如文本) 第二阶段: 响应过程.处理文本(如用NLP ...

  2. AI智能电话销售机器人源码搭建部署系统

    一般智能语音助理或语音机器人工作原理大致如下: 第一阶段: 语音到文本的过程.信号源→设备(捕获音频输入)→增强音频输入→检测语音→转换为其他形式(如文本) 第二阶段: 响应过程.处理文本(如用NLP ...

  3. 计算机毕业设计JAVA网上童装销售系统mybatis+源码+调试部署+系统+数据库+lw

    计算机毕业设计JAVA网上童装销售系统mybatis+源码+调试部署+系统+数据库+lw 计算机毕业设计JAVA网上童装销售系统mybatis+源码+调试部署+系统+数据库+lw 本源码技术栈: 项目 ...

  4. java毕业设计咖啡销售平台mybatis+源码+调试部署+系统+数据库+lw

    java毕业设计咖啡销售平台mybatis+源码+调试部署+系统+数据库+lw java毕业设计咖啡销售平台mybatis+源码+调试部署+系统+数据库+lw 本源码技术栈: 项目架构:B/S架构 开 ...

  5. java毕业设计葡萄酒销售管理系统mybatis+源码+调试部署+系统+数据库+lw

    java毕业设计葡萄酒销售管理系统mybatis+源码+调试部署+系统+数据库+lw java毕业设计葡萄酒销售管理系统mybatis+源码+调试部署+系统+数据库+lw 本源码技术栈: 项目架构:B ...

  6. java毕业设计拾忆鲜花销售系统mybatis+源码+调试部署+系统+数据库+lw

    java毕业设计拾忆鲜花销售系统mybatis+源码+调试部署+系统+数据库+lw java毕业设计拾忆鲜花销售系统mybatis+源码+调试部署+系统+数据库+lw 本源码技术栈: 项目架构:B/S ...

  7. 计算机毕业设计JAVA拾忆鲜花销售系统mybatis+源码+调试部署+系统+数据库+lw

    计算机毕业设计JAVA拾忆鲜花销售系统mybatis+源码+调试部署+系统+数据库+lw 计算机毕业设计JAVA拾忆鲜花销售系统mybatis+源码+调试部署+系统+数据库+lw 本源码技术栈: 项目 ...

  8. 计算机毕业设计JAVA钢材销售平台登录mybatis+源码+调试部署+系统+数据库+lw

    计算机毕业设计JAVA钢材销售平台登录mybatis+源码+调试部署+系统+数据库+lw 计算机毕业设计JAVA钢材销售平台登录mybatis+源码+调试部署+系统+数据库+lw 本源码技术栈: 项目 ...

  9. 计算机毕业设计JAVA家具销售管理系统mybatis+源码+调试部署+系统+数据库+lw

    计算机毕业设计JAVA家具销售管理系统mybatis+源码+调试部署+系统+数据库+lw 计算机毕业设计JAVA家具销售管理系统mybatis+源码+调试部署+系统+数据库+lw 本源码技术栈: 项目 ...

  10. java毕业设计离散制造业产品销售管理系统mybatis+源码+调试部署+系统+数据库+lw

    java毕业设计离散制造业产品销售管理系统mybatis+源码+调试部署+系统+数据库+lw java毕业设计离散制造业产品销售管理系统mybatis+源码+调试部署+系统+数据库+lw 本源码技术栈 ...

最新文章

  1. nodejs 开发企业微信第三方应用入门教程
  2. 一次哔哩哔哩面试经历,真香!
  3. 类的初始化(构造函数)
  4. 使用jQuery清空表单
  5. 为容器提供持久存储,这个方法试试看
  6. Java BigInteger类| 带实例的splitAndRemainder()方法
  7. 如何将手机投屏到电脑_使用向日葵软件如何将手机投屏到电脑上
  8. STM32F1移植UCOSII
  9. 【集合论】集合概念与关系 ( 真子集 | 空集 | 全集 | 幂集 | 集合元素个数 | 求幂集步骤 )
  10. miRNA数据库篇——Rfam数据库
  11. gis 数据框裁剪_【更新89篇】地理数据科学技术文章合集,欢迎大家点赞、在看、转发三连!...
  12. 考勤查询统计SQL脚本。
  13. MK808 vs Raspberry Pi
  14. 健壮F.T.+新裸金属重磅发布!全新升级版ZStack加速新基建!
  15. 【技术干货】详解BGP4+的负载分担
  16. 护眼灯护眼有效果吗?一文了解护眼灯到底有没有用
  17. RAM 大全-DRAM, SRAM, SDRAM的关系与区别
  18. Android 获得联系人并排序
  19. python 单词拆音节_计算一个单词的音节数
  20. HTAP数据库及应用场景简析

热门文章

  1. 小米球穿透工具使用步骤
  2. iOS C语言~bzero函数、memset函数
  3. Matlab读取TXT文本文件通用程序
  4. windows下安装VM虚拟机和Ubuntu系统(附注册密钥)
  5. php 易宝支付,网站接入易宝支付遇上的问题
  6. Java全套视频教程
  7. 重庆计算机c语言二级成绩查询,历届重庆市计算机C语言二级考试试题及答案.pdf...
  8. python无限锁屏_定时锁屏程序,Python祝你原理猝死!
  9. 中兴服务器 raid,中兴LIS等直通阵列卡卡硬盘检测工具
  10. 《模式分类》第二版 第二章课后编程题