Linux下科大讯飞语音识别全面总结
原标题:Linux下科大讯飞语音识别全面总结
首先我们需要的就是Linux下的SDK的下载包,首先在科大讯飞的官网http://www.xfyun.cn/注册,选择我们的语音识别的功能相应的Linux SDK下载,对应的生成Linux_iat1166_tts_online1166_5ad417ef.zip 的压缩包,然后解压缩如下:
bin目录下面是我们的生成的可执行的文件;
doc目录是我们的api函数接口的参考的文档;
include目录下面是我们的编译后的可执行文件用到的头文件;
libs是我们的程序用到的库;
samples目录下面是简单的语音合成、语音识别、语音转文字的demo;
切换到我们的samples下面的iat_record_sample的语音识别的demo,source 32bit_make.sh,在我们的bin目录下生成可执行文件iat_record_sample
但是执行时出现error while loading shared libraries: libmsc.so的错误
uame -a 或者uname -p查看我们的ubuntu虚拟机是32位还是64位的
再对应的将我们的libs目录下的库拷贝到/usr/libs下面
再运行我们的bin下面的生成的iat_record_sample可执行文件
但是我们demo只可以实现一次识别我们语音,故修改我们的代码让其可以一直等待输入,
并且每次等待输入的时间为10s钟,然后可以看到我们从本地的麦中发音,可以实现我们的语音转换为对应的文本
我们的main函数的login_params必须与我们自己申请的SDK的appid相同,不然云端在线时SDK与appid不一致无法使用语音的功能
为了实现一直输入,在我们的while(1)中调用demo_mic,其中demo_mic的sr_init、sr_start_listening、sr_stop_listening实现我们的语音的文件的起始和结束
sr_start_listening函数中的create_record、open_record、start_record、stop_record、close_record相关函数实现我们的录音对象的创建、打开、停止、关闭
责任编辑:
Linux下科大讯飞语音识别全面总结相关推荐
- Linux下利用python实现语音识别详细教程
Linux下python实现语音识别详细教程 语音识别工作原理简介 选择合适的python语音识别包 安装SpeechRecognition 识别器类 音频文件的使用 英文的语音识别 噪音对语音识别的 ...
- linux下运行htk,Linux下安装编译并且测试HTK语音识别库
决定写一个linux下的HTK的安装和测试,如果有人想看windows下的,可以看我之前的那篇文章 http://www.linuxidc.com/Linux/2013-03/80801.htm. 首 ...
- 科大讯飞 唤醒python_用Python来使用科大讯飞语音识别,so easy
在人工智能高速发展的今天,语音识别技术被带入到人们的工作和生活中,开始被越来越多的人关注和使用,今天,当各种在线客服被机器人客服代替,当速记翻译馆被语音识别代替,甚至当收银员.驾驶员.工厂工人.普通文 ...
- 科大讯飞语音识别技术实(yuan)战(ma)小结
1.准备工作 1.1 开通讯飞开放平台账号 https://www.xfyun.cn/ 可以领取免费套餐:https://www.xfyun.cn/free 1.2 下载语音处理类库TarsosDSP ...
- ubuntu64位(x86)下科大讯飞sdk使用注意事项
appleyuchi@Ubuntu16:~/demo$ gcc demo.c /tmp/cc1yENlA.o:在函数'get_grammar_id'中: demo.c:(.text+0x146):对' ...
- 交互系统的构建之(二)Linux下鼠标和键盘的模拟控制
交互系统的构建之(二)Linux下鼠标和键盘的模拟控制 zouxy09@qq.com http://blog.csdn.net/zouxy09 交互系统的构建之(一)http://blog.csdn. ...
- 科大讯飞语音识别demo
广告关闭 2017年12月,云+社区对外发布,从最开始的技术博客到现在拥有多个社区产品.未来,我们一起乘风破浪,创造无限可能. 到目前为止科大讯飞的javasdk不支持客户端和服务端分开的情况,也就是 ...
- 科大讯飞语音识别率从97%提升至98% 用AI赋能方言保护
原标题:科大讯飞语音识别率从97%提升至98% 用AI赋能方言保护 6月12日,讯飞输入法在北京启动"AI方言发音人招募"公益行动.在人工智能一天天渗透并改变我们生活的今天,科大讯 ...
- Windows下编译语音识别引擎Wenet
Windows下编译语音识别引擎Wenet 一.Wenet简介 二.Wenet首次编译过程 2.1下载第三方库源码 2.2替换软链接 2.3下载gRPC的third_party 三.Wenet第二次编 ...
最新文章
- 文本纠错与BERT的最新结合,Soft-Masked BERT
- 一文搞清楚,QPS、TPS、并发用户数、吞吐量
- Leetcode 138. 复制带随机指针的链表 解题思路及C++实现
- 【Window / 浏览器】 常用 快捷键 整理
- 如何在Linux下创建与解压zip, tar, tar.gz和tar.bz2文件 .
- 长能耐了?想造反了?你老婆没了.......
- mel滤波器组频率响应曲线_了解二阶滤波器的奈奎斯特图
- myeclipse连接mysql怎么调用_myeclipse连接mysql数据库详细步骤
- 使用frp进行内网穿透的实例
- ABAP操作Excel(转)
- 01_Redis基础
- FILESTREAM data cannot be placed on an empty filegroup 解决办法
- git上传到github
- Waymo也商业化了!“早期乘客”项目开始测试收费,凤凰城人民掏了腰包
- PYTHON1.day06
- java遍历字符串_Java后端开发算法基础面试题分享,你离大厂也许就差这份面试题
- Python入门--算术运算符,位运算符,比较运算符,布尔运算符,赋值运算符
- 刀片服务器接显示器,刀片服务器的vga切换方法
- 行业分析报告-全球与中国客户满意度(CSAT)调查软件市场现状及未来发展趋势
- uboot调试总结(freescale平台为例)