0 引言本文引用地址:http://www.eepw.com.cn/article/246037.htm

随着高新技术在军事领域的广泛运用,武器装备逐步向高、精、尖方向发展。传统的军事训练由于训练时间长、训练费用高、训练空间窄,常常不能达到预期的训练效果,已不能满足现代军事训练的需要。为解决上述问题,模拟训练应运而生。

为进一步提高训练效果,本文利用智能语音交互芯片设计了某模拟训练器的示教与回放系统。示教系统为操作人员生动的演示标准操作流程及相应的操作现象,极大地缩短了对操作人员的培训时间,提高了培训效果。回放系统通过记录操作训练过程中各操作人员的口令、声音强度、动作、时间、操作现象等,待操作训练结束后通过重演训练过程,以便操作者及时纠正自己的问题。示教系统也可理解为对标准操作训练过程的回放。该系统不需要虚拟现实技术的支持,在小型的嵌入式系统上就可以实现。

1 系统原理

该模拟训练器由一台测控计算机和多台从设备组成。如图1所示。在此仅对一台从设备进行介绍,其硬件系统主要由测控计算机、Arduino mega2560 控制器、语音识别单元、声强检测单元、语音合成单元、面板控制单元、仪器面板等组成。面板控制单元较为复杂,包含多种控制电路,在模拟训练中负责该从设备在Arduinomega2560 控制器的控制下完成整个训练过程,在示教与回放系统中完成对刚才操作训练操作现象的重演,其具体电路设计在此不做介绍。

语音识别单元负责识别操作人员的操作口令;声强检测单元负责检测声强大小并以此作为判断是哪台从设备操作人员口令的依据;Arduino mega2560控制器负责监视仪器面板各元件的状态来识别操作人员的动作,从而完成对操作训练过程的记录。各仪器的操作现象根据操作动作事先编制无需记录。在操作回放过程中,测控计算机根据所记录的数据,通过控制相应从设备的Arduino mega2560控制器重现所记录的操作过程。

2 单元系统设计

2.1 语音识别单元设计

目前,语音识别技术的发展十分迅速,按照识别对象的类型可以分为特定人和非特定人语音识别。特定人是指识别对象为专门的人,非特定人是指识别对象是针对大多数用户,一般需要采集多个人的语音进行录音和训练,经过学习,从而达到较高的识别率。

本文采用的LD3320语音识别芯片是一颗基于非特定人语音识别(Speaker?Independent Automatic SpeechRecognition,SI?ASR)技术的芯片。该芯片上集成了高精度的A/D 和D/A 接口,不再需要外接辅助的FLASH 和RAM,即可以实现语音识别、声控、人机对话功能,提供了真正的单芯片语音识别解决方案。并且,识别的关键词语列表是可以动态编辑的。其语音识别过程如图2所示。

语音识别单元采用ATmega168 作为MCU,负责控制LD3320完成所有和语音识别相关的工作,并将识别结果通过串口上传至Arduino mega2560 控制器。对LD3320芯片的各种操作,都必须通过寄存器的操作来完成,寄存器读写操作有2种方式(标准并行方式和串行SPI方式)。在此采用并行方式,将LD3320的数据端口与MCU的I/O口相连。其硬件连接图如图3所示。

语音识别流程采用中断方式工作,其工作流程分为初始化、写入关键词、开始识别和响应中断等。MCU的程序采用ARDUINO IDE编写[5],调试完成后通过串口进行烧录,控制LD3320完成语音识别,并将识别结果上传至Arduino mega2560控制器。其软件流程如图4所示。

2.2 声强检测单元设计

在进行语音识别时需要判断是某一台从设备操作人员的口令,为此设计声强检测单元电路,该电路仅需能够判断出相对声强的大小,无需检测声级,对检测精度要求较低。

电容式MIC声音传感器将外部声音信号转换成电信号,经NE5532放大电路进行放大,将输入的微弱音频信号转换为具有一定幅值的电压信号,该电压信号经AC/DC有效值转换电路进行装换后进行再次放大,最终由Arduino mega2560控制器的A/D进行采样。图5给出了声强检测单元的电路原理图,其中D1 端接Arduinomega2560控制器的A/D,INT1端接Arduino mega2560控制器的外部中断1.当外界声音信号大于预设的阈值时,三极管导通INT1端由高电平变为低电平产生外部中断,控制器响应中断并进行A/D 采样,采样数据经均值滤波后保存,待测控计算机查询时上传该声强数据。

2.3 语音合成单元设计

TTS(Text To Speech)文本转语音技术是人机智能对话发展的趋势。基于TTS技术的语音系统无需事先录音就能够随时根据查询条件查出并合成语音进行播报,从而大大减少了系统维护的工作量。利用此技术,通过MCU或者PC机就能控制语音芯片发音[4]。

本文采用SYN6658中文语音合成芯片进行语音合成。SYN6658 通过UART 接口或SPI接口通信方式,接收待合成的文本数据,实现文本到语音(或TTS语音)的转换[6]。控制器和SYN6658 语音合成芯片之间通过UART接口连接,控制器通过串口通信向SYN6658语音合成芯片发送控制命令和文本,SYN6658语音合成芯片把接收到的文本合成为语音信号输出,输出的信号经LM386 功率放大器进行放大后连接到喇叭进行播放。

如图6所示。

基于LD3320的非特定人语音识别方案相关推荐

  1. 基于ARM的非特定人语音识别系统设计

    0 引言本文引用地址:http://www.eepw.com.cn/article/247359.htm 随着高新技术在军事领域的广泛运用,武器装备逐步向高.精.尖方向发展.传统的军事训练由于训练时间 ...

  2. 基于非特定人语音识别芯片的技术方案

    0 引言 随着高新技术在军事领域的广泛运用,武器装备逐步向高.精.尖方向发展.传统的军事训练由于训练时间长.训练费用高.训练空间窄,常常不能达到预期的训练效果,已不能满足现代军事训练的需要.为解决上述 ...

  3. 非特定人语音识别,speaker-independent speech recognition,音标,读音,翻译,英文例句,英语词典...

    补充资料:汉语语音识别分类 汉语语音识别分类 classification of Chinese speech recognition 一种方法是用一个经过良好训练的非特定人或上述特定分类的标准样板或 ...

  4. 研究生语音识别课程作业记录(二) 非特定人孤立词识别

    研究生语音识别课程作业记录(二) 非特定人孤立词识别 前言 一. 任务要求 二. 识别方法 三. 语音数据库 四. 特征参数提取 五. 识别过程及分析 六. 小结 前言 研究生期间的语音识别课程作业记 ...

  5. [转载]基于Stm32,LD3320的非特定语音识别USB HID Keyboar

    基于Stm32,LD3320的非特定语音识别USB HID Keyboard实现 ---用声音跟机器沟通 鉴于手头拥有一块ST官方的stm32f407VG discover板子以及一块ICRoute公 ...

  6. 研究生语音识别课程作业记录(一) 非特定人孤立词识别

    研究生语音识别课程作业记录(一) 非特定人孤立词识别 前言 一. 任务要求 二. 识别方法 三. 语音数据库 四. 特征参数提取 五. 识别过程及分析 六. 小结 前言 研究生期间的语音识别课程作业记 ...

  7. 芯唐语音识别_大联大品佳推出基于新唐科技ISD9160+Cyberon算法的语音识别方案

    致力于亚太地区市场的领先半导体元器件分销商---大联大控股宣布,其旗下品佳推出基于新唐科技(Nuvoton)ISD9160+Cyberon算法的语音识别方案,此方案可支持20条本地的语音命令,还可外挂 ...

  8. 基于React-Native0.55.4的语音识别项目全栈方案

    [摘要] 移动端的API能力验证方案与PC端不一样!不一样!!不一样!!! 即使需要使用的API都存在,也不一定能用,这一点和PC端是有很大区别的,国内的手机系统虽然都是基于Android,但几乎都会 ...

  9. 基于LD3320的嵌入式语音识别系统设计

    摘要:语音交互系统是比较人性化的人机操作界面,它需要语音识别系统的支持.LD3320就是这样一款语音识别芯片.介绍了该芯片的工作原理及应用,给出了LD3320与微处理器的硬件接口电路及软件程序.随着高 ...

最新文章

  1. android adb root方法
  2. C# 使用Linq递归查询数据库遇到的问题及解决方法
  3. 20155213 2016-2017-2 《Java程序设计》第七周学习总结
  4. 解决 SSH 不能输入中文的问题
  5. pandas的DataFrame转化为Datatable的DataFrame
  6. java使用xml存储数据_聊一聊 Redis 数据内部存储使用到的数据结构
  7. x轴z轴代表的方向图片_游戏中到底是Z轴朝上还是Y轴朝上?
  8. c语言条件编译include,7.1编译与预处理-include-c学习 | 时刻需
  9. C++基础——一些细节、常犯错误的汇总
  10. 据说每年有四分一的房地产项目烂尾,房子都是预售的钱哪里去了?
  11. 20220521 将plecs输出的电路图转换为黑线白底
  12. 全国首个NB-IoT规模化商用 - BC95模块
  13. 自组网 AODV路由协议 篇1
  14. 多商户JAVA扫码点餐小程序源码SaaS模式
  15. ssms mysql_SQL Server Management Studio(SSMS)复制数据库的方法
  16. Nvidia Tesla M40 装机保姆教程
  17. 读书笔记:《软件架构师应该知道的97件事》
  18. 拿到软考高级证书就是高级职称了吗?
  19. Java之QQ界面实现
  20. 国内专业web报表工具,完美解决中国式报表难题

热门文章

  1. jvm 虚拟机的组成部分
  2. [No0000120]Python教程3/9-第一个Python程序
  3. Jar包冲突解决方法
  4. LeetCode Letter Combinations of a Phone Number
  5. spring mvc 解决csrf跨站请求攻击
  6. 你这辈子,为什么富不起来?!
  7. 如何使用ITEXTSHARP将HTML代码字符串写进PDF
  8. Bailian3258 兔子产子【递推+打表】
  9. CCF NOI1000 加密算法
  10. Java实现的大整数分解Pollard's rho算法程序