Linux下讯飞语音配置入门
本来是想在树莓派3上做开发的,可是没有树莓派3的SDK,在这里先在Linux上熟悉下讯飞语音。
Linux系统:Ubuntu16 64位
一、注册获取SDK
在讯飞开发者平台进行注册,注册分个人用户和企业用户,个人用户注册提供用户名和姓名,需要绑定手机号,企业用户除了需要以上信息外还需要纳税登记号和营业执照等资质信息。
注册好后在开发者平台首页下,按照新手接入流程进行操作就好了。
获取SDK是一个压缩包,解压后里面有测试文件,说明文档,头文件,库文件和例程等信息。
二、配置
将libs/x64/libmsc.so(64位系统)复制到/usr/local/lib/下,方便编译的可执行文件运行时寻找;复制完后要执行ldconfig使链接库生效;
$ sudo cp libs/x64/libmsc.so /usr/local/lib/
$ sudo ldconfig
三、编译
如果想快速的看演示效果,可以直接进入例程目录,执行
$ source 64bit_make.sh
可以在bin文件内生成对应的可执行文件。
三、例程介绍
进入samples例程目录,可以看到有7个例程,下面对这7个例程做一个简单介绍
asr_sample 语音识别示例
语音识别(Automatic Speech Recognition)技术能够从语音中识别出特定的命令词或语句模式;这里是将bin/wav/iflytek01.wav语音文件进行解析,解析结果如下:
解析出三条记录,用confidence来区分准确度,confidence值越大是越准确的,一般也是我们要使用的。iat_sample 语音听写示例
语音听写(iFly Auto Transform)技术能够实时地将语音转换成对应的文字。模拟人说话的场景进行语音解析。这里是解析一个bin/wav/iflytek02.wav音频文件,执行过程中会让用户选择是否上传用户词表,如果选择上传,后续解析到相关关键词时会提高解析准确率。
在这里我选择上传用户词列表时会出现10110的错误,没有授权许可,查询论坛http://bbs.xfyun.cn/forum.php?mod=viewthread&tid=26838&highlight=10110,说是没有效授权上传联系人10110的话是一般是uid没有,看下是否正确的进行了msplogin,如果没有获取到设备号,只是临时用户,生成不了唯一标识uid,是无效用户。解决此类情况,可以在参数中指定mac地址进行上传。这个怎么指定MAC地址还没找到方法,等后面更新。ise_sample 语音评测示例
语音评测是拿解析一个音频文件的内容和一个文本文件进行对比,音频文件的内容和文本文件是一样的 ,对比结果有一个评分,分值越高表示结果越好,至于具体分值代表的意思还没有在文档上看到。tts_sample 语音合成示例
语音合成(Text To Speech,TTS)技术能够自动将任意文字实时转换为连续的自然语音,是一种能够在任何时间、任何地点,向任何人提供语音信息服务的高效便捷手段,非常符合信息时代海量数据、动态更新和个性化查询的需求。sch_speak_sample 语音语义示例
语音语义技术能够将语音听写业务中的内容进行语义解析。本例中运行解析bin/wav/weather.pcm音频文件语义,
在进行语音语义测试时要确保开通了语音语义服务,如果没开通语音语义服务会提示14002错误;
语音语义服务可在开发者平台->控制台->开放语义里进行配置,可以进行语义抽取和智能问答的配置。sch_text_sample 文本语义示例
和语音语义功能类似,文本语义技术能将文本内容进行语义解析。iat_record_sample 录音听写示例
语音听写(iFly Auto Transform)技术能够实时地将语音转换成对应的文字。
这里会让用户选择是使用麦克风还是使用已录制好的音频文件。如果选择麦克风,程序会将用户对着麦克风说的语音解析成文字。这里可以使用tts_sample例程中的语音合成技术将结果合成音频文件进行播放,达到语音互动的效果。
这里编译时遇到一个错误:alsa/asoundlib.h: 没有那个文件或目录,安装libasound2-dev库文件可解决。
sudo apt-get install libasound2-dev
四、录音
参考:http://blog.csdn.net/yanghuan313/article/details/50992909
录音的话需要安装alsa-oss
$ sudo apt-get install alsa-oss
安装完以后,执行:
$ arecord -d 3 -r 16000 -c 1 -t wav -f S16_LE test.wav
-d : 录音时间(s)
-r : 频率
-c : 音轨
-t : 文件类型
-f : 格式
因为科大讯飞要求单音轨,16000HZ,16bit的采样,支持wav或者pcm
Linux下讯飞语音配置入门相关推荐
- 讯飞语音之语音转文字识别功能
应开发需求了解,项目中需要用到语音转换为文字的功能要求,所以调研了下讯飞和百度的语音功能,这里由于我是合肥人,所以我果断的用了讯飞的语音功能. 下面,简单介绍下讯飞语音听写功能的强大和集成 一.进入讯 ...
- linux下运行讯飞语音云的测试程序
from : http://club.voicecloud.cn/forum.php?mod=viewthread&tid=5484 摸索了一段时间,大概明白了如何在linux下运行讯飞语音云 ...
- 讯飞语音的详细配置使用
讯飞语音的详细配置使用 一.前言 我们正逐步走进人工智能时代,其中语音服务科技是一项十分重要,相当高大上的科技.腾讯推出腾讯云,百度也有自己的百度语音等,科大讯飞旗下的讯飞输入法,讯飞语音是两个不错的 ...
- 讯飞语音——带你简单实现语音听写
语音听写 de 简单实现 一.前言 如果你没有在讯飞语音平台上创建应用,请先参考讯飞语音的详细配置使用 二.功能描述 语音听写和语音合成都是较为基础也是最常使用的两个基本功能. 语音合成是将文本转化为 ...
- Unity与讯飞语音交互:使用aiui技能
语音交互 说到人工智能,离不开语音,大家会认为一个设备可以跟人对话是有智能的体现,在国内语音智能研发,讯飞是公认的做的最好的,在了解语音智能时,客户提的是讯飞,因为他们目标是要做一个好的语音交互.客户 ...
- 讯飞语音--唤醒Demo
写的第一篇博客,因为最近姐姐说起了一个段子, 一男子在地铁站手机找不到了,但是带了蓝牙耳机,耳机还有内容,男子想手机一定还在附近,随即大喊一句,悟空你在哪儿, 手机循环回答,我在这.....这时,拿手 ...
- Node + 讯飞语音 定时播放天气预报音频
前言 最近看了几篇文章,总觉得自己没发挥树莓派的作用,于是就琢磨着,哎,灵光一闪,整一个早晨叫醒服务,于是便有了本篇水文. 功能 每天早上八点钟,定时播放音频(音频内容为当天天气预报和空气质量),播放 ...
- 讯飞语音——文字转换语音
1.首先在讯飞开放平台注册账号 http://www.xfyun.cn/?ch=bdtg 2.在控制台添加应用 获得APPID 然后添加应用 之后就是下载SDK了 在组合服务下载SDK中下载 下载好后 ...
- 如何通过讯飞语音将文本合成后的语音保存到本地
如何通过讯飞语音将文本合成后的语音保存到本地 2014-2-21分类:Android, 解决方案, 随手实例 | 暂无评论 转自:http://www.krislq.com/2014/02/voice ...
最新文章
- p点到(a,b)点两所在直线的垂点坐标及p点是否在(a,b)两点所在直线上
- python绘制散点图-Python:matplotlib绘制散点图
- caffe matio问题
- switch java 语法_Java编程—switch语句语法详解
- centos7 docker
- oracle数据库中分析函数大全,Oracle数据库的分析函数
- c语言输出中文为乱码_C语言输出乱码问题
- 物联网行业常用术语(含软件和硬件)
- Caused by: java.lang.NoSuchMethodError:xxx——依赖冲突的解决
- Unknown host 'dl.google.com'. You may need to adjust the proxy settings in Gradle.
- adobe绿色版cs6下载地址
- 6000级石阶见证绝世爱情
- Windows7双屏扩展及双屏桌面背景独立显示
- html用九张图片做出九宫图,九宫切图软件 如何快速把照片做成九宫格切图
- 如何锁定 input 内容不可修改
- Android怎么查看手机中的本地数据库
- nfc卡模式与标准模式_NFC 的通信模式。什么是点对点模式,什么是模拟卡和读卡器模式...
- 扫雷c语言课程设计报告,扫雷游戏实验报告.docx
- CacheCloud的入门运用与实战
- 猛犸创始人季逸超:互联网新人类
热门文章
- 69张一刻相册日漫绘画分享
- Node.js基础入门第四天
- 工作日志(人谷科技初体验)
- Excel学习笔记-函数(IF、AND、OR、Countif、Countifs)
- springboot旅游公司网站设计 毕业设计-附源码110929
- 适合所有实体店的营销方案,让所有人无法抗拒的成交主张!
- 易语言组件花源码花大法防误报免杀360QVM云引擎(洪雨原创)
- 激光清洗机_机械激光清洗机
- #C++# #likely# #unlikely#减少CPU流水线分支预测错误带来的性能损失
- 详解c++---红黑二叉树的原理和实现