一般智能语音助理或语音机器人工作原理大致如下:

第一阶段:
语音到文本的过程。信号源→设备(捕获音频输入)→增强音频输入→检测语音→转换为其他形式(如文本)

第二阶段:
响应过程。处理文本(如用NLP处理文本,识别意图)→操作响应。

在检测语音过程中,就包括分辨是否为语音信号,该过程会通过指定的频率对模拟信号进行采样,将模拟声波转换为数字数据。这一过程很重要,是否成功地识别语音。如果生成数字数据都是错误的,那么后期的处理响应那肯定是错的。这也是影响智能语音助理或语音机器人识别率的重要因素。

在这个过程,用于语音处理的技术是语音活性检测 (Voice activity detection,VAD),目的是检测语音信号是否存在。 VAD技术主要用于语音编码和语音识别。它可以简化语音处理,也可用于在音频会话期间去除非语音片段:可以在IP电话应用中避免对静音数据包的编码和传输,节省计算时间和带宽。

文本将与大家分享VAD技术,首先讲两个概念:
信噪比(缩写为SNR或S / N)是科学和工程中使用的一种度量,它将所需信号的电平与背景噪声电平进行比较。
SNR定义为信号功率与噪声功率之比,通常以分贝表示。比率高于1:1(大于0 dB)表示信号多于噪声。
窗口,研究信号源,我们将其分成滑动窗口或仅窗口。

编辑

能量检测器

能量检测器对于高SNR信号是有效的,但是当SNR下降直到它在1以下变得无效时失去效率。它也不能将语音与诸如冲击噪声(将笔放在桌子上),打字,空调或任何噪声之类的噪声区分开来。比人声更响亮或更响亮。

波形和频谱分析

在波形和频谱分析中,语音活动检测利用语音的已知特征。在该方法中应用VAD比基于能量的解决方案更加计算密集,但是能够更好地检测非平稳噪声和低SNR场景中的噪声。

对于浊音音素,声带的振动产生谐波丰富的声音,具有50到250 Hz之间的明显音调。所有元音,但也有一些辅音,表现出这种谐波结构,因此是语音的特征。代表谐波结构的特征是语音的可靠指标。然而,单独使用基于谐度或基于音调的特征不能预期无声语音部分(例如一些摩擦音)被检测到。此外,音乐或其他谐波噪声分量可能被误解为语音。

总的来说,对信号的倒谱的分析可以揭示信号能量的来源。

同样的,基于该共振峰结构,也是语音识别系统的重要特征。人类声道中的可变腔允许扬声器形成不同的音素。强调谐振(或共振峰)频率,导致频谱包络的特征形状。

平滑很重要,在一个对话中,一个人只有50%的时间在说话,并且存在大量非活动帧。诸如[p] [t] [k] [b]之类的音是静音,并且静音部分可能不会被算法识别为语音,这将影响自动语音识别系统的性能。

解决方案如下:

要被视为语音,必须至少有3个连续的窗口标记语音(192ms)。它可以防止短暂的噪音被视为语音。

要被认为是沉默,必须至少连续3个窗口标记为静音。它可以防止过多的语音切入影响语音节奏。

如果窗口被认为是语音,则前3个窗口和3个窗口被认为是语音。它可以防止在句子开头和结尾丢失信息。

基于统计分析

MFCC,FBANK,PLP是最常用的语音识别功能。有数学运算的连接,旨在通过保持最相关的数据来减少和压缩信息的数量。

在“信号源→设备(捕获音频输入)→增强音频输入→检测语音”过程中,语音成功采样识别为数字数据,是后期语言处理的前提,在检测中文面临更大挑战,断句、语气、语调等因素直接影响识别率。

因此,语音活性检测会影响电话机器人的识别率。

AI智能电话销售机器人源码搭建部署系统相关推荐

  1. AI智能电话销售机器人源码搭建部署系统电话机器人源码,电话机器人噪音处理

    一般智能语音助理或语音机器人工作原理大致如下: 第一阶段: 语音到文本的过程.信号源→设备(捕获音频输入)→增强音频输入→检测语音→转换为其他形式(如文本) 第二阶段: 响应过程.处理文本(如用NLP ...

  2. AI智能电话机器人源码搭建揭秘

    AI智能电话机器人源码搭建揭秘! 随着人工智能的普及,AI已经渗透到各行各业,本文就为大家介绍了利用最前沿的AI技术实现电话机器人的原理.智能电话机器人就是充分的利用了人工智能语音识别技术和大数据的精 ...

  3. 智能电话机器人源码搭建的原理与功能

    AI智能电话机器人源码搭建揭秘! 随着人工智能的普及,AI已经渗透到各行各业,本文就为大家介绍了利用最前沿的AI技术实现电话机器人的原理.智能电话机器人就是充分的利用了人工智能语音识别技术和大数据的精 ...

  4. AI智能语音机器人源码供应批发采购

    AI智能语音机器人源码供应批发采购,智能電話机器人作为当今的一款智能化产品,在实际应用中能准确的以人类的声音.思维和语气智能应对客户提出的各种问题. 科技革新智能化浪潮来袭,如智能家居.智能办公.智能 ...

  5. AI智能电话销售机器人源代码开发独立部署软件系统

    2018年是AI人工智能类产品开始爆发的一年,非常火热的当属AI智能电话销售机器人莫属了,小编近期从圈子里听说,贵州诚企创思网络科技有限公司近期智能电话机器人源代码开始对外了,我们专访了其技术负责人, ...

  6. 官方AI语音系统电销机器人系统搭建|AI智能|电话机器人源码|2022最新电销外呼系统多服务器版本七牛科大免费识别阿里免费识别科大识别阿里识别

    http://qiniuuu.tuantouqiye.com/FkpF_3b4R0CX31joNPrUbgboDjVghttp://qiniuuu.tuantouqiye.com/FkpF_3b4R0 ...

  7. 官方AI语音系统电销机器人系统搭建|AI智能|电话机器人源码|最新电销外呼系统多服务器版本七牛科大免费识别阿里免费识别科大识别阿里识别电话机器人

    端是VUE后端是java还有CC++  4台服务器组成nginx,kafka,mysql数据库,fs.支持大并发,通话录音存储七牛云可以自定义录音存储时长不用担心录音多影响系统硬盘存储空间可自定义删除 ...

  8. ai智能电话机器人源码安装 部署好后,人工智能电话机器人

    我们先做一个选择题: 有这样2个销售员,小王一个月跟进100个客户,成交20个:小杨,跟进了120个客户,成交了24个.成单率都在20%,假如你是老板,你选择谁? 很明显,老板都喜欢小杨这样的员工.因 ...

  9. 青语易呼电销机器人源码独立部署搭建步骤

    青语易呼电销外呼系统外呼系统源码,独立部署步骤: 一.基本配置及检出fusionpbx 修改软件源为http://downloads.openwrt.org/snapshots/trunk/ar71x ...

最新文章

  1. python使用matplotlib可视化3D线框图、线框图可以将数据投影到指定的三维表面上,并输出可视化程度较高的三维效果图
  2. BugKuCTF WEB web5
  3. linux服务器基本常识,服务器搭建-Linux基础知识
  4. 关于关闭SELinux的方法
  5. python语法学习_Python学习1——语法
  6. dev sda2 linux lvm,VM下LINUX完美增加硬盘空间(LVM)
  7. Facebook究竟是怎么抄袭Snapchat的?听听他们自己怎么说
  8. android 获取monkey日志_Monkey日志如何分析
  9. 本周Asp.net源码更新(6.25-6.29)
  10. 我错了——虚拟光驱 for linux
  11. MATLAB神经网络工具箱 BP神经网络函数化表示 BP神经网络梯度\求导函数
  12. OpenCV—Python Retinex图像增强算法
  13. drupal 电商网站_为什么小型企业应该为电子商务网站选择Drupal
  14. 膨胀卷积(空洞卷积)
  15. 电商APP首页楼层架构设计详解
  16. 国产化替代加速升温,智和信通着力信创技术再迎突破
  17. Hexo+NexT 如何取消下划线
  18. 【CCF】公共钥匙盒
  19. 1w存银行一年多少利息_100万存银行一年利息是多少?
  20. 微型计算机代表性机型,微型计算机原理及应用技术

热门文章

  1. 进制转化之16进制与10进制相互转换
  2. ANN-MLP(神经网络--多层感知器)
  3. [HIT-DB-Lab3] 数据库的多路归并算法及其实现
  4. 以身试法!盗版XP黑屏实测 教你一招:WGA新版破解方法[转自太平台电脑网]
  5. qq公众平台出错了609_微信公众号粉丝去哪买?有哪些购买渠道?
  6. JavaScript console 详解
  7. autocad2014 菜单栏 闪退_AutoCAD2014_Windows 10 闪退
  8. 融优学堂生物演化14.9
  9. 艾永亮:超级产品战略如何让优衣库做到“零库存”
  10. 数据权限的设计与实现