讯飞语音识别和唤醒开发示例

最近需要用到讯飞的语音识别和语音唤醒的功能,就对这方面进行了一下简单研究。

本文帮助大家简单入门,并且提供几个代码示例给大家参考。

讯飞开发者网址:https://www.xfyun.cn/

讯飞的部分功能,如图:

本文只介绍一点语音相关的内容。如果需要可以看看。

一.创建自己的讯飞应用

这里需要先注册自己的讯飞账号。并且进行实名验证。

登陆后,看到右上角有个“控制台”的文本,点击进去,就可以创建我们的应用了。

输入应用的基本信息,如图:

创建自己的应用后,可以对自己的应用进行编辑,添加自己需要集成的功能,
如图:

创建的应用中有个属性APPID是在讯飞SDK初始化的时候需要用到的。下载的Demo中也有使用方法。

讯飞的功能是部分免费的,部分是体验的,有些是收费的。

比如,我这里添加了语言识别和语音唤醒功能,如图:

在后期是可以对自己的应用进行编辑,增加其他模块的功能的。

点击下载SDK,我们就可以进行讯飞的集成进行开发了。

二.讯飞集成开发

讯飞SDK下载后得到的文件,如图:

assets、res是一些资源文件
lib中是一些jar包和so库
sample是讯飞给我们提供的demo程序,这个很重要,如果是新手最好看看demo的代码参考开发
readme.txt是简单的注意事项
release.txt是一些版本的信息
wordlist.txt是自己设置的唤醒的关键字

我这里的SDK是集成了语音识别和唤醒功能的,但是我发现sample中有两个示例程序。

有一个demo是有唤醒功能代码的,另一个demo是没有唤醒功能代码的。

有唤醒功能代码的demo,资源文件缺少APPID.jet文件,这个文件在下载的SDK的res/ivw中,

需要复制到项目中的assets文件夹中,才能使用唤醒功能。

1.语音识别

主要控制的类

 // 语音听写对象private SpeechRecognizer mIat;

这个类实例化后,进行参数配置,就可以调用start,stop,cancel等方法进行识别控制

这里讯飞语音不是等你说完在进行识别的,而是一边说,它会一边帮你识别,
所以讯飞默认情况是会在你不说话的时候自动结束识别。

讯飞的语音识别也是有两种形式的,一种是有讯飞自定义的对话框显示的形式,另一种是没有对话框显示的形式。

具体的控制逻辑可以参考demo。

2.唤醒

唤醒记得要复制对的APPID.jet到正确的位置,才能进行有效唤醒。

但是我参考讯飞demo写的代码,只有WakeDemo这个类的唤醒有效,另一个类OneShotDemo的类唤醒无效!

三.这里我把几个项目的代码发给大家参考:

下载地址:https://download.csdn.net/download/wenzhi20102321/10573210

里面的文件说明:

1.my文件夹

这个是我从讯飞开发者中下载的完整的SDK代码,里面包括讯飞提供两个demo代码和一些资源文件

2.XunfeiDemo.rar

这个是我自己根据讯飞SDK中的Demo开发的简单例子,

这个例子里面只开发了语音识别和简单唤醒的功能。

唤醒的关键字是:美女你好

3.MySpeech.rar

这个也是别人根据其他讯飞SDK的Demo开发的例子

里面没有开发唤醒功能,但是有其他比较多的功能实现。

4.里面还提供了两个apk文件,可以安装看看效果

这两个apk如果使用adb install 可能安装失败,因为是调试版本
需要使用adb install -t 才能安装成功

共勉:智者的梦再美,也不如愚人实干的脚印。

讯飞语音识别和唤醒开发示例相关推荐

  1. 腾讯、百度、讯飞 语音识别

    一.腾讯语音识别-一句话语音识别 1.账号申请 (1)搜索腾讯云官网 https://cloud.tencent.com/?fromSource=gwzcw.2212127.2212127.22121 ...

  2. 讯飞语音识别配置笔记

    不久前开发过讯飞语音识别和小程序结合的系统,发表了一篇配置记录,有一些同学问一下问题,我再把我但是自己做的另外一篇记录发出来,给需要的同行参考一下.上一篇文章的地址:http://blog.csdn. ...

  3. unity通过WebAPI连接Websocket实现讯飞语音识别与合成。

    下载地址:https://download.csdn.net/download/qq_39735878/12447473 unity写的讯飞语音识别合成与评测功能,走的是webapi,连接讯飞WebS ...

  4. 语音识别技术原理是什么 讯飞语音识别技术特点介绍【详解】

    语音识别技术原理简介 自动语音识别技术(Auto Speech Recognize,简称ASR)所要解决的问题是让计算机能够"听懂"人类的语音,将语音中包含的文字信息"提 ...

  5. Flutter版讯飞语音识别demo

    xf_demo是根据科大讯飞语音听写的WebAPI编写的Flutter版demo 官方文档地址:https://www.xfyun.cn/doc/asr/voicedictation/API.html ...

  6. python实时语音智能聊天<讯飞语音识别+青云客机器人>

    python基于 讯飞语音识别实现语音智能聊天 GitHub项目链接:https://github.com/superzhangjc/python-Voice_chat.git

  7. 讯飞语音识别demo实现

    最近看了看百度语音和讯飞语音识别的实现,吐个槽,他们的官方文档是真的写得垃圾,可能是我技术不到位, 反正我是很难看懂的,不吐槽了,先上实现 讯飞的官方文档 https://doc.xfyun.cn/m ...

  8. 使用Java的讯飞语音识别示例

    简单介绍 最近看到了语音识别和合成的博客,很多平台都提供了语音识别/合成的接口,比如百度和讯飞.感觉讯飞提供的接口更标准更丰富,详细内容可以看官网:讯飞开放平台.结合了另一篇博客<用Java跟图 ...

  9. 【Demo】iOS平台上的讯飞语音识别语音合成开发

    官方文档:http://www.xfyun.cn/doccenter/iOS 目前开放的服务: 准备工作 需要到讯飞官网注册一个开发账号,注册后登录并创建一个新的应用,添加需要的服务(语音听写.语音合 ...

最新文章

  1. 红旗桌面版本最新运用要领和成果解答100例-7
  2. html中表格的页眉页脚,有一个标准的页眉页脚布局HTML网页,而无需使用table标签...
  3. 清除浮动的方法总结CSS实现水平垂直居中方法总结
  4. Kotlin入门(16)容器的遍历方式
  5. jquery扩展提示框
  6. 希哲求大神教 技术额
  7. python的ogr模块_Python与开源GIS:使用OGR模块打开矢量数据
  8. 探讨【IGE】的源代码【一】。
  9. matlab混合copula,​MATLAB实战—最优Copula函数的选择
  10. 多边形扩展和收缩(凸多边形和凹多边形)
  11. 常见B端产品经理面试问题及答案(一)
  12. 100003字,带你解密 双11、618电商大促场景下的系统架构体系
  13. 神州优车拟41亿元收购宝沃汽车67%股权 1
  14. QuickCam Gev 2.0 开发
  15. 网页鼠标点击特效案例收集(直播间红心同理)
  16. 抖音如何能快速涨粉?
  17. 计算机桌面怎么情理,关于电脑桌面上的流氓图标要怎么清理???
  18. Day10-feign结合Hystrix使用-p163、p164
  19. 百度小程序接入搜索结果-标准化服务SPU指导手册
  20. 李泉老师《商务拜访礼仪》

热门文章

  1. Latent Semantic Analysis
  2. 微信小程序用户拒绝授权地理位置信息再次调起授权窗口
  3. 802.1x准入技术
  4. 项目经理如何激励团队
  5. 活着,本身就是最美的事 唯美生活生命感悟美文
  6. 使用Tensorflow 检测是否正确佩戴口罩(二)
  7. 视频倍速如何一键调整
  8. 树莓派 python开发_树莓派4b开发之开发环境搭建
  9. 数据结构 树 思考题2
  10. 华为交换机重置console密码