原标题:Linux下科大讯飞语音识别全面总结

首先我们需要的就是Linux下的SDK的下载包,首先在科大讯飞的官网http://www.xfyun.cn/注册,选择我们的语音识别的功能相应的Linux SDK下载,对应的生成Linux_iat1166_tts_online1166_5ad417ef.zip 的压缩包,然后解压缩如下:

bin目录下面是我们的生成的可执行的文件;

doc目录是我们的api函数接口的参考的文档;

include目录下面是我们的编译后的可执行文件用到的头文件;

libs是我们的程序用到的库;

samples目录下面是简单的语音合成、语音识别、语音转文字的demo;

切换到我们的samples下面的iat_record_sample的语音识别的demo,source 32bit_make.sh,在我们的bin目录下生成可执行文件iat_record_sample

但是执行时出现error while loading shared libraries: libmsc.so的错误

uame -a 或者uname -p查看我们的ubuntu虚拟机是32位还是64位的

再对应的将我们的libs目录下的库拷贝到/usr/libs下面

再运行我们的bin下面的生成的iat_record_sample可执行文件

但是我们demo只可以实现一次识别我们语音,故修改我们的代码让其可以一直等待输入,

并且每次等待输入的时间为10s钟,然后可以看到我们从本地的麦中发音,可以实现我们的语音转换为对应的文本

我们的main函数的login_params必须与我们自己申请的SDK的appid相同,不然云端在线时SDK与appid不一致无法使用语音的功能

为了实现一直输入,在我们的while(1)中调用demo_mic,其中demo_mic的sr_init、sr_start_listening、sr_stop_listening实现我们的语音的文件的起始和结束

sr_start_listening函数中的create_record、open_record、start_record、stop_record、close_record相关函数实现我们的录音对象的创建、打开、停止、关闭

责任编辑:

Linux下科大讯飞语音识别全面总结相关推荐

  1. Linux下利用python实现语音识别详细教程

    Linux下python实现语音识别详细教程 语音识别工作原理简介 选择合适的python语音识别包 安装SpeechRecognition 识别器类 音频文件的使用 英文的语音识别 噪音对语音识别的 ...

  2. linux下运行htk,Linux下安装编译并且测试HTK语音识别库

    决定写一个linux下的HTK的安装和测试,如果有人想看windows下的,可以看我之前的那篇文章 http://www.linuxidc.com/Linux/2013-03/80801.htm. 首 ...

  3. 科大讯飞 唤醒python_用Python来使用科大讯飞语音识别,so easy

    在人工智能高速发展的今天,语音识别技术被带入到人们的工作和生活中,开始被越来越多的人关注和使用,今天,当各种在线客服被机器人客服代替,当速记翻译馆被语音识别代替,甚至当收银员.驾驶员.工厂工人.普通文 ...

  4. 科大讯飞语音识别技术实(yuan)战(ma)小结

    1.准备工作 1.1 开通讯飞开放平台账号 https://www.xfyun.cn/ 可以领取免费套餐:https://www.xfyun.cn/free 1.2 下载语音处理类库TarsosDSP ...

  5. ubuntu64位(x86)下科大讯飞sdk使用注意事项

    appleyuchi@Ubuntu16:~/demo$ gcc demo.c /tmp/cc1yENlA.o:在函数'get_grammar_id'中: demo.c:(.text+0x146):对' ...

  6. 交互系统的构建之(二)Linux下鼠标和键盘的模拟控制

    交互系统的构建之(二)Linux下鼠标和键盘的模拟控制 zouxy09@qq.com http://blog.csdn.net/zouxy09 交互系统的构建之(一)http://blog.csdn. ...

  7. 科大讯飞语音识别demo

    广告关闭 2017年12月,云+社区对外发布,从最开始的技术博客到现在拥有多个社区产品.未来,我们一起乘风破浪,创造无限可能. 到目前为止科大讯飞的javasdk不支持客户端和服务端分开的情况,也就是 ...

  8. 科大讯飞语音识别率从97%提升至98% 用AI赋能方言保护

    原标题:科大讯飞语音识别率从97%提升至98% 用AI赋能方言保护 6月12日,讯飞输入法在北京启动"AI方言发音人招募"公益行动.在人工智能一天天渗透并改变我们生活的今天,科大讯 ...

  9. Windows下编译语音识别引擎Wenet

    Windows下编译语音识别引擎Wenet 一.Wenet简介 二.Wenet首次编译过程 2.1下载第三方库源码 2.2替换软链接 2.3下载gRPC的third_party 三.Wenet第二次编 ...

最新文章

  1. 文本纠错与BERT的最新结合,Soft-Masked BERT
  2. 一文搞清楚,QPS、TPS、并发用户数、吞吐量
  3. Leetcode 138. 复制带随机指针的链表 解题思路及C++实现
  4. 【Window / 浏览器】 常用 快捷键 整理
  5. 如何在Linux下创建与解压zip, tar, tar.gz和tar.bz2文件 .
  6. 长能耐了?想造反了?你老婆没了.......
  7. mel滤波器组频率响应曲线_了解二阶滤波器的奈奎斯特图
  8. myeclipse连接mysql怎么调用_myeclipse连接mysql数据库详细步骤
  9. 使用frp进行内网穿透的实例
  10. ABAP操作Excel(转)
  11. 01_Redis基础
  12. FILESTREAM data cannot be placed on an empty filegroup 解决办法
  13. git上传到github
  14. Waymo也商业化了!“早期乘客”项目开始测试收费,凤凰城人民掏了腰包
  15. PYTHON1.day06
  16. java遍历字符串_Java后端开发算法基础面试题分享,你离大厂也许就差这份面试题
  17. Python入门--算术运算符,位运算符,比较运算符,布尔运算符,赋值运算符
  18. 刀片服务器接显示器,刀片服务器的vga切换方法
  19. 行业分析报告-全球与中国客户满意度(CSAT)调查软件市场现状及未来发展趋势
  20. uboot调试总结(freescale平台为例)

热门文章

  1. vue/iview使用moment.js
  2. BZOJ 1207(dp)
  3. java设计模式--简单工厂模式
  4. python之条件判断、循环和字符串格式化
  5. Android之——AsyncTask和Handler对照
  6. Android--启动拍照功能并返回结果
  7. VBA Mysql 类
  8. 管理结果集和分析结果集
  9. HDU6109 数据分割【并查集】
  10. Bailian2739 计算对数【对数】