本发明涉及语音识别领域,特别是涉及到一种本地和云端相结合的语音识别系统及方法。

背景技术:

目前语音识别作为一种常用的人机交互技术,已广泛应用于各类电子产品中,以其自然方便的交互方式收到了消费者的喜爱,逐渐成为了智能产品时代的主流交互控制方式,语音识别目前有两类方式,一类是在线的自由对讲方式,用户使用时可以随意讲话,由产品设备采集到用户讲话内容,通过WIFI模组等设备上传到云端服务器进行语义分析理解,解析出用户的用意,再通过网络传到产品设备中进行相应的操作控制,这种方式优点在于用户可自由讲话,比较接近人们的日常生活习惯,但缺点在于需要网络才能使用;另一类语音识别的方式是通过本地识别模组进行的本地语音控制命令词的识别,该类方式无需使用网络,具有响应速度快,控制简单等优点,但需要事先设定好语音控制命令词,产品设备需识别到完整的语音控制命令词后才会响应,无法实现自由对讲,体验感不高。

为解决上述问题,需要发明一种即能实现用户在线自由讲话,又具备响应速度快和控制简单的本地和云端相结合的语音识别系统及方法。

技术实现要素:

本发明的目的在于克服现有技术中所存在的上述不足,提供一种能进行在线自由讲话并且响应速度快控制简单的本地和云端相结合的语音识别系统及方法。

为了达到上述目的,本发明提供了如下技术方案:

一种本地和云端相结合的语音识别系统,其包括:本地语音识别模组、与所述本地语音识别模组进行数据传输的WIFI模组、与所述WIFI模组进行数据传输的云端语音识别服务器。

作为本发明的优选方案,所述本地语音识别模组进行语音信号采集并识别所述语音信号获得本地语音识别结果和识别得分,得分的高低表征本地语音识别结果的准确程度,所述WIFI模组传输所述语音信号到所述云端语音识别服务器,所述云端语音识别服务器对所述语音信号进行识别并获得在线语音识别结果,所述云端语音识别服务器将得到的所述在线语音识别结果通过所述WIFI模组传输给所述本地语音识别模组,所述本地语音识别模组进行逻辑判断以确定最终输出的语音识别结果。

作为优选方案,本发明定义得分高对应准确程度高,得分低对应准确度低,如果反过来定义也可。

本发明还提供了如下技术方案:

一种本地和云端相结合的语音识别方法,其包括以下步骤:

步骤一 本地语音识别模组采集语音信号并识别所述语音信号获得本地语音识别结果和本地语音识别结果得分;

步骤二 判断是否有网络,若无网络或网络信号差时则直接采用所述本地语音识别结果并进入最后一个步骤,若有网络则进入下一步;

步骤三 WIFI模组发送所述语音信号至云端语音识别服务器,所述云端语音识别服务器分析所述语音信号获得在线语音识别结果;

步骤四 所述云端语音识别服务器将所述在线语音识别结果通过所述WIFI模组传输给所述本地语音识别模组;

步骤五 所述本地语音识别模组将所述本地语音识别结果得分与一设定的阈值进行比较,若所述本地语音识别结果得分高于或等于所述阈值则选取所述本地语音识别结果,若所述本地语音识别结果得分低于所述阈值则选取所述在线语音识别结果,所述阈值根据设计需求进行设定;

步骤六 将所述步骤五的选取结果输出。

与现有技术相比,本发明的有益效果:

本发明使用本地和云端相结合的方法,实现了用户在线自由讲话,并且具备响应速度快和控制简单的特点。

附图说明

图1为本发明框架图;

图2为本发明流程图。

具体实施方式

下面结合实施例及具体实施方式对本发明作进一步的详细描述,但不应将此理解为本发明上述主体的范围仅限于以下的实施例,凡基于本发明内容所实现的技术均属于本发明的范围。

实施例1

如图1所示,一种本地和云端相结合的语音识别系统,该系统包括本地语音识别模组、WIFI模组及云端语音识别服务器,本地语音识别模组进行语音信号采集并识别语音信号获得本地语音识别结果和得分,WIFI模组传输语音信号到云端语音识别服务器,云端语音识别服务器对语音信号进行识别并获得在线语音识别结果,云端语音识别服务器将得到的在线语音识别结果通过WIFI模组传输给本地语音识别模组,WIFI模组是通用模组,适用于移动、电信及联通等,在本实施例中本地语音识别模组采用麦克风采集语音信号。

实施例2

如图2所示,一种本地和云端相结合的语音识别方法,其包括以下六个步骤:

步骤一 本地语音识别模组采集语音信号并识别语音信号获得本地语音识别结果和本地语音识别结果得分,本实施例中本地语音识别模组采集“打开机器”这条语音信号;

步骤二 判断是否有网络,若无网络或网络信号差时则直接采用本地语音识别结果并直接进入最后一个步骤,若有网络则进入下一步;

步骤三 WIFI模组发送语音信号至云端语音识别服务器,云端语音识别服务器分析语音信号获得在线语音识别结果;

步骤四 云端语音识别服务器将在线语音识别结果通过WIFI模组传输给本地语音识别模组;

步骤五 本地语音识别模组将本地语音识别结果得分与一设定的阈值进行比较,若本地语音识别结果得分高于或等于阈值则选取本地语音识别结果,若本地语音识别结果得分低于阈值则选取在线语音识别结果;

步骤六 将步骤五的选取结果输出,最终输出“打开机器”这条语音指令。

在本实施例中,“打开机器”语音指令中的机器可以是所有家用电气,比如电视、空调、电脑、洗衣机、微波炉等等,可以直接控制家庭中的各种电器设备,当用户的部分语言超出设定词条范围时,比如“我要去上海”等,本地识别模组的本地语音识别结果得分将低于设定阈值,则该系统选择来自云端语音识别服务器返回的结果。

在其他实施例中,该方法可以直接应用于某个电气设备,比如应用于语音音箱中,定义“音量大点”、“音量小点”、“下一首歌”等命令词为本地语音识别词条,如果本地语音识别结果得分高于或等于所设定的阈值,则说明待识别的词条包含在上述本地语音识别词条范围内,并且识别良好,则采用本地识别结果,进行快速的控制响应,如果本地语音识别结果得分低于所设定的阈值,则说明待识别的词条未包含在上述本地语音识别词条范围内或者识别可靠性不高,则选择来自云端识别结果。

一种本地和云端相结合的语音识别系统及方法与流程相关推荐

  1. 语音识别维特比解码_一种基于维特比算法的花洒语音识别系统及方法与流程

    本发明涉及语音识别技术领域,具体涉及一种基于维特比算法的花洒语音识别系统及方法. 背景技术: 随着生活水平的提高和住房条件的改善,很多家庭都安装了沐浴设施,花洒是其中最常见的淋浴装置.目前花洒产品多为 ...

  2. android gps导航省电,一种GPS导航中省电的系统和方法与流程

    一种gps导航中省电的系统和方法,应用于通过gps(或者类似的北斗.伽利略)导航的领域. 背景技术: 在移动设备领域(手机.车载导航等),通过卫星导航应用非常普遍,几乎全部的手机,大部分的汽车,自身都 ...

  3. matlab识别中国象棋棋盘,一种基于图像处理的中国象棋识别系统及方法与流程

    本发明涉及计算机图像识别技术,具体涉及一种基于图像处理的中国象棋识别系统及方法. 背景技术: 数字图像处理技术在机器感知领域应用十分广泛,主要目标是通过一些图像处理技术从图像中提取信息,该信息类似于人 ...

  4. 一种云端语音识别系统及方法

    一种云端语音识别系统及方法 [技术领域] [0001]本发明属于语言分析技术领域,尤其涉及一种云端语音识别系统及方法. [背景技术] [0002]随着移动互联网.车联网和智能家居的发展,语音识别发挥了 ...

  5. 一种提升语音识别准确率的方法与流程

    本发明涉及语音识别技术领域,特别涉及一种提升语音识别准确率的方法. 背景技术: 人机交互是通过输入,输出设备,以有效的方式实现人与机器对话的技术.已广泛应用在消费电子,通信,家电,医疗,汽车等各个行业 ...

  6. matlab血糖预测,一种基于VMD-PACF-BP模型的动态血糖在线预测方法与流程

    本发明属于血糖预测技术领域,尤其涉及一种基于VMD-PACF-BP模型的动态血糖在线预测方法. 背景技术: 目前,中国患有糖尿病人数已成为在世界上拥有糖尿病患者最多的国家.为了降低糖尿病患者长期处于高 ...

  7. 一种机器人语音识别系统及其工作方法与流程

    本发明属于语音识别技术领域,特别是涉及一种机器人语音识别系统及其工作方法. 背景技术: 随着计算机技术的迅猛发展,人类社会已步入了高度自动化和信息化的时代.可以说计算机技术的发展大大加快了人类社会的进 ...

  8. 应用linux系统的机器人,一种基于linux的机器人系统及方法与流程

    技术特征: 1.一种基于linux的ros+android+移动底盘rtos深度融合的机器人系统,其特征在于,包括器人主板.移动底盘以及云端,所述机器人主板为linux系统.ros系统以及androi ...

  9. 小优机器人系统恢复_一种机器人异常恢复系统及方法与流程

    本发明涉及异常恢复系统及方法,尤其涉及一种机器人异常恢复系统及方法. 背景技术: 目前,一些家庭拥有机器人,机器人对人类的生活有很大的影响,它给了人们更加智能化舒适化的享受:但是,当机器人在运行某些应 ...

最新文章

  1. Database Appliance并非Mini版的Exadata-还原真实的Oracle Unbreakable Database Appliance
  2. Ueditor编辑旧文章,从数据库中取出要修改的内容
  3. 一个链接orcal的标准链接方法
  4. Python 技巧篇-开头注释怎么写最好,开头注释需要包含什么,开头注释的重要性
  5. Spring 常用注入注解(annotation)和其对应xml标签
  6. 海南计算机网络技术学校,三亚广播电视大学计算机网络技术专业_海南报名_网络教育计算机网络技术专业教学计划_中国教育在线...
  7. ggplot2设置坐标轴范围_R语言数据可视化| ggplot2中会“分身术”的facet_wrap()与facet_grid()...
  8. sparksql整合hive
  9. 无人机官方网站_用上5G和无人机,你家高楼也可以做 体检
  10. 关于 Oracle 存储双活配置和实战
  11. msf监听php反弹shell,使用msf进行反弹shell+内网渗透
  12. 字符串char与string转换
  13. ccf小明种苹果(续)
  14. SSM框架配置文件加载流程
  15. 紫书刷题记录 UVa12100 打印队列
  16. Unity中加载倾斜摄影模型、dem叠加卫星影像做真实地形
  17. 零死角玩转stm32初级篇5-流水灯的前后今生
  18. 原神3.2剧情服搭建教程
  19. Mac的最新版本JDK下载失败的解决方法
  20. 裴波那契数列(循环实现递归)

热门文章

  1. 用 label 控制 Pod 的位置 - 每天5分钟玩转 Docker 容器技术(128)
  2. MySQL数据丢失情况分析
  3. ios开发--编码格式
  4. PyCharm 下提示 'no module named time'
  5. java的反射机制(第二篇)
  6. [Lua]Lua入门教程
  7. ResourceBundle和Properties(转载)
  8. 新法规将处罚垃圾邮件制造者
  9. Bailian4147 汉诺塔问题(Hanoi)
  10. 《程序设计技术》第四章例程