语音识别の目录

  • 一、科大讯飞平台下载开放包及语音验证
  • 二、ROS环境下的语音识别与输出
    • 1.ROS语音识别
    • 2.ROS语音输出
    • 3.ROS语音识别与输出
    • 4.ROS语音交互
    • 编写launch文件:打开语音识别节点和语音助手节点 ![在这里插入图片描述](https://img-blog.csdnimg.cn/486fd1bf8afe48b1bd749d7293f5edb2.png) 在终端执行roslaunch robot_voice_824 voice_assistant.launch ![在这里插入图片描述](https://img-blog.csdnimg.cn/ab5f828203604a2a8e32775115d95832.png)
  • 总结

一、科大讯飞平台下载开放包及语音验证

提示:本文针对的是语音识别中的语音识别(流式版)
讯飞平台:链接传送门
需要先注册账号,然后创建自己的应用才能够对开放包进行下载(每个开放包都有自己的APPID号,这个很重要!)

创建应用的界面

下载的包

将开放包下载到linux系统中

这是包中各个文件及其里面的内容

重点要用到的是samples里面的这些包

进入iat_online_record_sample功能包下,执行.sh脚本文件进行编译


二、ROS环境下的语音识别与输出

1.ROS语音识别

首先在工作空间下,建立语音识别的ROS功能包
工作空间如何创建?链接传送门

执行完指令后,框架如下,include包含科大讯飞程序的头文件,src包含引用科大讯飞接口的ROS代码



这块是不需要修改的。

主函数


代码块完成之后,就是对Cmakelist进行修改了

然后对工作空间下的robot_voice进行编译,也可以单独编译

最后进行语音识别的测试

2.ROS语音输出

把科大讯飞平台提供的语音输出功能包中的.c文件放到robot_voice_824/src文件夹中,并改名为tts_subscribe.cpp




subscriber:订阅/voiceWords话题接受输入字符串。
回调函数:使用SDK接口将字符串转换成语音。


修改Cmakelist
在该文件下添加以下编译规则:


最后是ROS语音输出编译

语音输出演示

3.ROS语音识别与输出

多节点,配置launch文件

4.ROS语音交互

每一个.cpp代表一个节点,创建语音交互的节点


在原来的回调函数中增加以下代码

保存cpp并在Cmakelist增加新的编译规则

catkin_make:编译语音相关功能包

编写launch文件:打开语音识别节点和语音助手节点

在终端执行roslaunch robot_voice_824 voice_assistant.launch

总结

以上就是关于科大讯飞语音识别SDK的ROS包修改。在资源里,有笔者现成的ROS功能包,直接在工作空间下,便能运行,但是需要注意APPID的修改。链接传送门
如有侵权,请及时与笔者联系。//抱拳

科大讯飞语音识别SDK的ROS包修改相关推荐

  1. 【ROS】科大讯飞语音SDK+Ubuntu16.04 + kinetic 实践报错记录及解决方案(1):cannot find -lmsc

    前言 这段时间在ubuntu 16.04 kinetic上想要实现语音助手的功能,经过搜索相关ROS语音交互相关资料发现有很多方案,如pocketsphinx这是国外的语音功能包,能够实现语音识别的功 ...

  2. RealSence 驱动及ROS包配置笔记

    RealSence 驱动及ROS包配置笔记 1. 下载SDK及ROS包 打开https://github.com/IntelRealSense/librealsense/releases.下载对应版本 ...

  3. 利用科大讯飞语音合成模块SDK实现ROS语音交互

    利用科大讯飞语音合成模块SDK实现ROS语音交互 本文内容与CSDN博主「AI Chen」的原创文章相同,可以直接参考原文:https://blog.csdn.net/qq_39400324/arti ...

  4. ROS+科大讯飞语音识别控制机器人

    科大讯飞语音识别控制实际机器人运动. 本文将ros与语音识别想结合进行开发.进行以下步骤, 1.创作ros工作空间 2.安装mpalyer播放器 sudo apt-get install mplaye ...

  5. Linux下科大讯飞语音识别全面总结

    原标题:Linux下科大讯飞语音识别全面总结 首先我们需要的就是Linux下的SDK的下载包,首先在科大讯飞的官网http://www.xfyun.cn/注册,选择我们的语音识别的功能相应的Linux ...

  6. 【人工智能】科大讯飞语音识别应用开发(第三集)

    前言 这次需要对科大讯飞语音识别接口进行语音识别应用开发,前两次都是通过WebAPI调用接口,这次换一下,通过SDK调用接口 下面是开发的详细记录过程(基于前两次的基础上) 语音识别接口调用 第一步 ...

  7. Android 科大讯飞语音SDK集成步骤

    前言 科大讯飞语音虽好,其严格的认证与校验确实精密,不过也大大提高了开发者的集成难度,并非危言耸听,我想大多数人都有经历过 11210(用户ID与离线资源不匹配) 21480( 离线引擎GUID不一致 ...

  8. 安卓Android科大讯飞语音识别代码使用详解

    科大讯飞的语音识别功能用在安卓代码中,我把语音识别写成了Service,然后在Fragment直接调用service服务.科大讯飞语音识别用的是带对话框的那个,直接调用科大讯飞的语音接口,代码采用链表 ...

  9. 百度Android在线语音识别SDK用法

    百度Android语音识别SDK分在线与离线两种,这篇文章介绍在线SDK的用法. 在线SDK是以JAR包和动态链接库形式公布和使用,能够从百度开放云平台站点中下载SDK及使用说明文档. 完毕语音SDK ...

  10. 科大讯飞语音识别demo

    广告关闭 2017年12月,云+社区对外发布,从最开始的技术博客到现在拥有多个社区产品.未来,我们一起乘风破浪,创造无限可能. 到目前为止科大讯飞的javasdk不支持客户端和服务端分开的情况,也就是 ...

最新文章

  1. 中学再不学编程就晚了?MIT、JHU研究:程序员大脑思考代码的机制不对劲
  2. Openwrt 刷机后配置WAN口,安装luci和设置中文、安装挂载USB存储。
  3. thinkphp读写mysql的枷锁_thinkphp5 数据库配置读写分离
  4. Eclipse+CDT+MinGW搭建C++环境 (转)
  5. java 同步方式 lock_Java的同步锁(Lock)
  6. Java中如何引用另一个类里的集合_【18期】Java序列化与反序列化三连问:是什么?为什么要?如何做?...
  7. 初学 Delphi 嵌入汇编[12] - 在汇编代码中可以直接使用 Result
  8. 花里胡哨?一起来看看 PyCharm 2019.3 增加了哪些新功能吧
  9. freemarker 转义字符
  10. 利用LR做性能测试中出现的常见问题解决方案
  11. 【应用多元统计分析】CH5 判别分析3——贝叶斯判别
  12. C语言------冲突声明(conflicting declaration)
  13. 牛客网python版本多行输入输出
  14. 使用zabbix_sender发送文本
  15. 江西赣州计算机应用中心,赣州计算机应用与维修专业学校
  16. dell电脑如何安装ubuntu系统_Dell台式机安装Ubuntu 16.04注意事项( Alienware R6)
  17. Required view 'XXX' with ID XXX for field 'xxx' was not found
  18. 杰米棋牌开发商打造经典棋牌游戏
  19. wml 与服务器交互
  20. excel和python建模_如何用Python提高办公(Excel)效率?

热门文章

  1. 将国际标准时间和时间戳转换成年月日时分秒
  2. 四、FFI和第三方模块
  3. IDEA 可以提神开发效率的插件
  4. 法语学习笔记——语音
  5. 奥城大学计算机专业,2013年美国留学硕士双录取院校一览
  6. ubantu安装环境
  7. MySQL 5.7 中文全文检索
  8. Liunx安装Ubuntu系统
  9. android rgb接口,Android RGB颜色查询对照表
  10. 旧笔记本改linux桌面,在老旧笔记本电脑上成功安装xubuntu