一、插件推荐

  • 跨平台Office文档、图片在线预览,视频播放原生插件
  • Android和IOS图片在线预览,视频播放原生插件
  • 跨平台Android和IOS百度OCR文字识别、证卡识别、票据识别原生插件

二、准备工作

1. Android、IOS端证书准备工作

  • Android端:生成Android打包keystore证书文件及获取MD5(非常重要),参考文档:Android平台签名证书(.keystore)生成指南 - DCloud问答
  • IOS端:Windows系统下申请IOS证书、Mac系统下申请IOS证书

2. 百度资料准备

  • 进入百度AI开放平台

  • 点击右上角控制台登录,若无账号,请先注册账号

  • 登录后,若没有实名认证,请先实名认证,推荐企业实名认证(可使用功能更多)

  • 选择语音技术 —》创建应用

    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-eXKf7DLI-1659206646067)(https://p3-juejin.byteimg.com/tos-cn-i-k3u1fbpfcp/a85ce750505a4b44802f8b4cecbc8783~tplv-k3u1fbpfcp-zoom-1.image)]

  • 获取API Key、Secret Key以及License文件

    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-EDF366Re-1659206646069)(https://p3-juejin.byteimg.com/tos-cn-i-k3u1fbpfcp/2369be14dbd64b4f8b0cb47cae47ed6d~tplv-k3u1fbpfcp-zoom-1.image)]

  • 百度语音识别接口收费详情,请在百度控制台—》概述查看,或者直接查看产品定价文档

    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-DNxJRuhq-1659206646070)(https://p3-juejin.byteimg.com/tos-cn-i-k3u1fbpfcp/0dae8e9b71a647f89a2ba8484a089baa~tplv-k3u1fbpfcp-zoom-1.image)]

三、快速上手

  • Step1:下载本插件示例项目,或者下载GitHub - silianpan/Seal-UniPlugin-Demo

  • Step2:打开manifest.json—》基础配置—》重新获取DCloud AppID

  • Step3:点击试用

  • Step4:打开manifest.json—》App原生插件配置—》选择云端插件

    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-9IzlYwGd-1659206646074)(https://p3-juejin.byteimg.com/tos-cn-i-k3u1fbpfcp/eb223b4f2f3644d2bf4a1214b8ad80d2~tplv-k3u1fbpfcp-zoom-1.image)]

  • Step5:制作自定义调试基座:在HBuilderX菜单中点击运行—》运行到手机或模拟器—》制作自定义调试基座,填写步骤及注意事项如下图

    附:debug.keystore下载链接,仅仅用作测试

    Keystore name: “debug.keystore” Keystore password: “android” Key alias: “AndroidDebugKey” Key password: “android”

    md5:A5:61:77:2E:AA:63:15:18:47:D6:5B:EC:6A:FA:F4:0A

    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-lSM0AjpK-1659206646075)(https://p3-juejin.byteimg.com/tos-cn-i-k3u1fbpfcp/d7b69f2177424a829df560f1ab0c420b~tplv-k3u1fbpfcp-zoom-1.image)]

  • Step6:选择自定义调试基座:点击运行—》运行到手机或模拟器—》基座运行选择—》自定义调试基座

  • Step7:调试运行:点击运行—》运行到手机或模拟器—》运行到Android App基座

四、接口使用手册

  • 插件方法一:recogOnlineStart,开始在线识别
  • 方法参数
参数 类型 默认值 是否必填 说明
appId string null 百度AI开放平台控制台应用AppID
appKey string null 百度AI开放平台控制台应用Api Key
appSecret string null 百度AI开放平台控制台应用Secret Key
pid int null PID,语种,详细说明如下
lmId int null 自训练平台ID,请选PID=8002生效
enableLongSpeech bool false 长语音,优先级高于vad_endpoint_timeout
vadEndpointTimeout int null VAD时长设置,长语音选择0
vad string dnn VAD是否开启,dnn,默认,推荐模型;touch,关闭静音断句功能,用户手动停止录音。
infile string null 外部音频,可以是:资源路径或回调方法名 该参数支持设置为: a. pcm文件,系统路径,如:/sdcard/test/test.pcm;音频pcm文件不超过3分钟 b. pcm文件, JAVA资源路径,如:res:///com/baidu.test/16k_test.pcm;音频pcm文件不超过3分钟 c. InputStream数据流,#方法全名的字符串,格式如:”#com.test.Factory.create16KInputStream()”(解释:Factory类中存在一个返回InputStream的方法create16kInputStream()),注意:必须以井号开始;方法原型必须为:public static InputStream create16KInputStream()。 超过3分钟的录音文件,请在每次read中sleep,避免SDK内部缓冲不够。
multiInvoke bool true 是否保持多次语音识别结果回调
checkPermRecordAudio bool true 是否开启检查录音权限
isFinish bool false 是否结束识别
  • PID,语种详细说明

    • 在线参数, 请根据语言, 输入法模型及是否需要在线语义,来选择PID。

      • 语言:目前支持中文普通话,四川话,粤语,和英语四个
      • 输入法模型:适用于较长的句子输入。默认有标点,不支持在线语义; 开启标点后,不支持本地语义。
      • 自训练平台模型: 在输入法模型的基础上,可以自行上传词库和句库,生成您自己的训练模型。
      • 在线语义:在线语义只支持普通话(本地语义也是只支持普通话)。在线语义对识别结果的文字,再做结构化解析,找到语句的“关键词”。在线语义详细说明请查看“语义理解协议”文档。
      • Unit 2.0 语义:功能类似在线语义,但是可以自定义解析。
      • 补充:PID=8001,自训练平台输入法模型;PID=8002,自训练平台搜索模型。

    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-BXsZ6cKj-1659206646080)(https://p3-juejin.byteimg.com/tos-cn-i-k3u1fbpfcp/45befc001c1743faaa680e4320608a90~tplv-k3u1fbpfcp-zoom-1.image)]

  • 代码示例

    sealVoiceASRModule.recogOnlineStart({// appId: '',// appKey: '',// appSecret: '',enableLongSpeech: true},ret => {const resultCode = ret.code;console.log('resultCode', resultCode);if (resultCode === 1000) {modal.toast({message: `正在在线识别,开始标识:${resultCode}`,duration: 3});this.recogOnlineBtn = '正在在线识别...';} else if (resultCode === 1001) {this.recogText += JSON.parse(ret.result).result + ' '// uni.showModal({//  content: `获取在线识别结果(${resultCode}):` + ret.result// });// modal.toast({//  message: '获取在线识别结果:' + ret.result,//  duration: 3// })}}
    );
    
  • 接口返回格式

    {code: 1001,result: '识别结果'
    }
    
  • 接口回调结果状态码说明

    状态码 说明
    1000 识别开始
    1001 识别成功,返回识别结果 解析识别结果格式,参考:https://cloud.baidu.com/doc/SPEECH/s/Qkh089ydu 识别结果错误码参考:https://cloud.baidu.com/doc/SPEECH/s/qk38lxh1q
    1002 识别结束
  • 插件方法二:recogOnlineEnd,结束识别

  • 也可以调用recogOnlineStart方法,传递{ isFinish: true }参数

  • 代码示例

    // 调用recogOnlineStart接口,传递isFinish为true
    // sealVoiceASRModule.recogOnlineStart({ isFinish: true }, ret => {
    sealVoiceASRModule.recogOnlineEnd({}, ret => {const resultCode = ret.code;if (resultCode === 1002) {modal.toast({message: `识别结束,结束标识:${resultCode}`,duration: 3});this.recogOnlineBtn = '开始在线识别';}
    });
    

五、后续计划

  • IOS端支持

六、本插件需要申请的系统权限列表

  • Android端需要申请的权限列表

    • android.permission.READ_EXTERNAL_STORAGE 读取 SD 卡中的内容
    • android.permission.WRITE_EXTERNAL_STORAGE 修改或删除 SD 卡中的内容
    • android.permission.INTERNET 访问网络连接
    • android.permission.RECORD_AUDIO 录音权限
  • Android端:插件功能使用百度开放平台语音识别SDK,参考其官方网站 https://ai.baidu.com/tech/speech

各位同学,对于插件使用还有疑问的,可以加QQ群(170683293)咨询。

跨平台Android和IOS百度语音在线识别原生插件相关推荐

  1. 通过百度语音在线识别控制灯和播放本地音乐

    参考链接:https://blog.csdn.net/qazwyc/article/details/57153734 本文所有代码链接:https://pan.baidu.com/s/1LT5LBkO ...

  2. 安卓(Android)开发百度语音唤醒(识别)

    安卓(Android)开发百度语音唤醒(识别) 目录 安卓(Android)开发百度语音唤醒(识别) 一:准备 1:获取自定义唤醒词 2:SDK下载 3:将bdasr_V3_xxx_xxx.jar引入 ...

  3. 基于springboot+h5+websocket的即时通讯客服系统和百度实时语音转译(语音在线识别)

    本文章由本人原创 下载链接:https://download.csdn.net/download/u014191624/51948075 这是一个基于springboot+h5+websocket的即 ...

  4. 安卓Android、iOS移动端车牌识别OCR技术原理

    核心内容:移动端车牌识别.安卓端车牌识别.Android车牌识别.iOS端车牌识别.OCR识别技术 一.安卓Android.iOS移动端车牌识别OCR技术识别流程 安卓Android.iOS移动端车牌 ...

  5. Windows PC、 Linux、 Android、 iOS多平台支持H5无插件播放RTSP摄像机解决方案

    Windows PC. Linux. Android. iOS多平台支持H5无插件播放RTSP摄像机解决方案 需求分析 视频流媒体监控行业已经进入互联网时代,浏览器承载了绝大多数的互联网访问流量,目前 ...

  6. unity3d:百度语音在线语音转文字,文字转语音,跨平台

    转自洪流学堂 语音转文字 1.打开麦克风记录 _clipRecord = Microphone.Start(null, false, 30, 16000); 2.将Unity的AudioClip数据转 ...

  7. 百度语音识别——在线识别

    在线识别语音技术 1. 开发背景 2. 开发过程 2.1 下载SDK 2.2 熟悉源码 2.2.1 初始化 2.2.2 开始识别/唤醒 2.2.3 回调事件 2.2.4. 控制识别/唤醒 2.2.5. ...

  8. android之基于百度语音合讯飞语音识别的语音交互

    app:http://fir.im/gval 这里面包含拨盘UI 开发平台:android studio 模拟一个  原始需求如下: 1)  在界面上,通过声音提示用户讲话: 2)  将语音内容转换为 ...

  9. python百度语音实时识别成文字

    python 实现百度AI语音实时识别成文字 百度AI接口https://console.bce.baidu.com/ai/?_=1559654571070&fromai=1#/ai/spee ...

最新文章

  1. 提供《华容道与数据结构》代码供测试
  2. 页面转发后文本显示???_使用Divi的滑动动画显示过程的进度
  3. 4.2 Tensorflow笔记:池化函数
  4. js拦截物联返回键跳转到指定页面
  5. windows7 x86_64系统安装xampp后apache无法启动,端口冲突
  6. rman copy相关
  7. html中为什么style中不显示发光点,css实现发光文字,以及一点点js特效
  8. 第六章 副词(Les adverbes )
  9. 手机应用只清理不够,还要卸载
  10. gooflow 自定义流程图
  11. 牛客练习赛63 牛牛的树行棋
  12. vue官网中文文档下载,vue官网最新版本下载
  13. 第一步:文献阅读与翻译
  14. NoSQL Scylla Open Source 3.0食量比Cassandra大
  15. 给ubuntu添加字体
  16. 【Captain America Sentinel of Liberty HD】美国队长:自由哨兵 v1.0.2
  17. 我上半年深陷泥淖的往事
  18. 时间序列预测 EViews
  19. SystemTap应用跟踪探测的使用
  20. 博弈论中常见的一些例子

热门文章

  1. Cas(04)——更改认证方式
  2. 【FPGA开发笔记】—— 数码管动态显示项目详细剖析+个人心得体会
  3. 卡方线性趋势检验_统计学第七章 卡方检验【R语言实现】
  4. FD的设置和抓取python请求包
  5. 91.video.ws index php_如何利用videojs实现视频列表循环播放(完整代码)
  6. 每次打开电脑浏览器首页的同时,还会一并弹出网页广告,而且有时还是不一样的解决办法
  7. .net篇(1)--js写日历
  8. 思科网计算机网络第一章测验,思科计算机网络课程设计——第一章路由概念测试答案...
  9. 使用echarts完成市级的图表
  10. HTML5期末大作业:服装购物网站设计——粉色服装购物商城(4页) 服装购物商城网页设计作品 大学生购物专题网页设计作业模板 商店静态HTML网页模板下载