一、准备工作

1、首先你需要去科大讯飞的官网去注册一个账号,怎么注册我就不说了,然后去控制台,创建新应用。

2、下载对应的sdk,点击sdk下载,记住这里的APPID码,sdk初始化要用。

3、下载语音听写和在线语音合成对应的sdk(离线的语音听写需要手机安装语+这个软件才能用,离线语音合成收费,我就没考虑)

4、将压缩文件中的assets和lib放到项目中,需要注意的是如果是Android studio项目,lib文件夹中的.so相关文件夹都应该放在jniLibs文件夹里,直接放到libs下无法识别。

二、SDK初始化

与大部分的sdk一样越早初始化越好,免得用的时候忘了,初始化失败导致调用不成功,所以我选择在自定义的application中初始化,代码如下:

public class MyApplication extends Application {@Override
    public void onCreate() {/* 应用程序入口处调用,避免手机内存过小,杀死后台进程后通过历史intent
           进入Activity造成SpeechUtility对象为null*/

        /* 注意:此接口在非主进程调用会返回null对象,如需在非主进程使用语音功能,
           请增加参数:SpeechConstant.FORCE_LOGIN+"=true"
           参数间使用“,”分隔。
           设置你申请的应用appid*/

        // 注意: appid 必须和下载的SDK保持一致,否则会出现10407错误

        StringBuffer param = new StringBuffer();param.append("appid="+getString(R.string.app_id));param.append(",");// 设置使用v5+
        param.append(SpeechConstant.ENGINE_MODE+"="+SpeechConstant.MODE_MSC);SpeechUtility.createUtility(MyApplication.this, param.toString());super.onCreate();}
}

三、语音听写功能

1、使用讯飞提供的UI

   

i.定义语音听写UI控件

//语音听写UI
private RecognizerDialog reDialog;

ii.定义语音听写初始化监听,监听初始化是否成功

/**
 * 语音听写初始化监听器。
 */
private InitListener mInitListener = new InitListener() {@Override
    public void onInit(int code) {Log.d("zhangdi", "SpeechRecognizer init() code = " + code);if (code != ErrorCode.SUCCESS) {showTip("初始化失败,错误码:" + code);}}
};

iii.初始化语音听写UI

// 初始化听写Dialog,如果只使用有UI听写功能,无需创建SpeechRecognizer
// 使用UI听写功能,请根据sdk文件目录下的notice.txt,放置布局文件和图片资源
reDialog = new RecognizerDialog(this,mInitListener);

iv.定义听写UI的听写回调监听

/**
 * 听写UI监听器
 */
private RecognizerDialogListener mRecognizerDialogListener = new RecognizerDialogListener() {@Override
    public void onResult(RecognizerResult results, boolean b) {//正确回调
        Log.d("zhangdi", "recognizer result:" + results.getResultString());//解析返回的json字符
        String text = JsonParser.parseIatResult(results.getResultString());//将返回的结果显示在edittext中
        resultText.append(text);resultText.setSelection(resultText.length());}/**
     * 识别回调错误.
     */
    public void onError(SpeechError error) {if(mTranslateEnable && error.getErrorCode() == 14002) {showTip( error.getPlainDescription(true)+"\n请确认是否已开通翻译功能" );} else {showTip(error.getPlainDescription(true));}}};

v.在语音听写对应的按钮点击事件中显示UI

// 显示听写对话框
reDialog.setListener(mRecognizerDialogListener);
reDialog.show();
showTip(getString(R.string.text_begin));

2.使用自己的UI界面

i.定义语音听写对象

//语音听写对象
private SpeechRecognizer recognizer;

ii.定义语音听写初始化监听,监听初始化是否成功

/**
 * 语音听写初始化监听器。
 */
private InitListener mInitListener = new InitListener() {@Override
    public void onInit(int code) {Log.d("zhangdi", "SpeechRecognizer init() code = " + code);if (code != ErrorCode.SUCCESS) {showTip("初始化失败,错误码:" + code);}}
};

iii.初始化听写对象

// 初始化识别无UI识别对象
// 使用SpeechRecognizer对象,可根据回调消息自定义界面;
recognizer = SpeechRecognizer.createRecognizer(this, mInitListener);

iv.对听写对象进行参数设置

/**
     * 参数设置
     * @return
     */
    public void setParamRecognizer(){// 清空参数
        recognizer.setParameter(SpeechConstant.PARAMS, null);// 设置引擎,目前只支持云端模式,本地模式需要手机安装语+软件才能用
        recognizer.setParameter(SpeechConstant.ENGINE_TYPE, SpeechConstant.TYPE_CLOUD);// 设置返回结果格式
        recognizer.setParameter(SpeechConstant.RESULT_TYPE, "json");// 设置语言
        recognizer.setParameter(SpeechConstant.LANGUAGE, "zh_cn");// 设置语言地区,普通话
        recognizer.setParameter(SpeechConstant.ACCENT, "mandarin");// 设置语音前端点:静音超时时间,即用户多长时间不说话则当做超时处理
        recognizer.setParameter(SpeechConstant.VAD_BOS, "4000");// 设置语音后端点:后端点静音检测时间,即用户停止说话多长时间内即认为不再输入, 自动停止录音
        recognizer.setParameter(SpeechConstant.VAD_EOS, "1000");// 设置标点符号,设置为"0"返回结果无标点,设置为"1"返回结果有标点
        recognizer.setParameter(SpeechConstant.ASR_PTT, "1");// 设置音频保存路径,保存音频格式支持pcm、wav,设置路径为sd卡请注意WRITE_EXTERNAL_STORAGE权限
        // 注:AUDIO_FORMAT参数语记需要更新版本才能生效
//        recognizer.setParameter(SpeechConstant.AUDIO_FORMAT,"wav");
//        recognizer.setParameter(SpeechConstant.ASR_AUDIO_PATH, Environment.getExternalStorageDirectory()+"/msc/iat.wav");
    }

v.在语音听写对应的按钮事件中为听写对象设置回调监听

recognizer.startListening(new RecognizerListener() {@Override
    public void onVolumeChanged(int i, byte[] bytes) {Log.i("zhangdi","i = "+i+"bytes = "+bytes.toString());}@Override
    public void onBeginOfSpeech() {showTip("开始说话");}@Override
    public void onEndOfSpeech() {showTip("结束说话");}@Override
    public void onResult(RecognizerResult recognizerResult, boolean b) {resultText.append(recognizerResult.getResultString());}@Override
    public void onError(SpeechError speechError) {showTip(speechError.getErrorDescription());}@Override
    public void onEvent(int i, int i1, int i2, Bundle bundle) {Log.i("zhangdi","i = "+i+" i1 = "+i1+" i2 = "+i2);}
});

四、语音合成功能

1.定义语音合成对象

// 语音合成对象
private SpeechSynthesizer mTts;

2.语音合成初始化监听

/**
 * 语音合成初始化监听。
 */
private InitListener mTtsInitListener = new InitListener() {@Override
    public void onInit(int code) {Log.d("zhangdi", "InitListener init() code = " + code);if (code != ErrorCode.SUCCESS) {showTip("初始化失败,错误码:"+code);} //else {
            // 初始化成功,之后可以调用startSpeaking方法
            // 注:有的开发者在onCreate方法中创建完合成对象之后马上就调用startSpeaking进行合成,
            // 正确的做法是将onCreate中的startSpeaking调用移至这里
        //}
    }
};

3.初始化语音合成对象

// 初始化合成对象
mTts = SpeechSynthesizer.createSynthesizer(this, mTtsInitListener);

4.为语音合成对象设置参数

private void setParamTTS() {// 清空参数
    mTts.setParameter(SpeechConstant.PARAMS, null);//设置使用云端引擎,本地语音合成是收费的,所以忽略了
    mTts.setParameter(SpeechConstant.ENGINE_TYPE, SpeechConstant.TYPE_CLOUD);//设置发音人
    mTts.setParameter(SpeechConstant.VOICE_NAME,voicerCloud);//设置合成语速
    mTts.setParameter(SpeechConstant.SPEED, "50");//设置合成音调
    mTts.setParameter(SpeechConstant.PITCH, "50");//设置合成音量
    mTts.setParameter(SpeechConstant.VOLUME, "50");//设置播放器音频流类型
    mTts.setParameter(SpeechConstant.STREAM_TYPE, "3");// 设置播放合成音频打断音乐播放,默认为true
    mTts.setParameter(SpeechConstant.KEY_REQUEST_FOCUS, "true");}

5.定义语音合成监听回调

/**
 * 合成回调监听。
 */
private SynthesizerListener mTtsListener = new SynthesizerListener() {@Override
    public void onSpeakBegin() {showTip("开始播放");}@Override
    public void onSpeakPaused() {showTip("暂停播放");}@Override
    public void onSpeakResumed() {showTip("继续播放");}@Override
    public void onBufferProgress(int percent, int beginPos, int endPos,String info) {// 合成进度
        mPercentForBuffering = percent;showTip(String.format(getString(R.string.tts_toast_format),mPercentForBuffering, mPercentForPlaying));}@Override
    public void onSpeakProgress(int percent, int beginPos, int endPos) {// 播放进度
        mPercentForPlaying = percent;showTip(String.format(getString(R.string.tts_toast_format),mPercentForBuffering, mPercentForPlaying));}@Override
    public void onCompleted(SpeechError error) {if (error == null) {showTip("播放完成");} else if (error != null) {showTip(error.getPlainDescription(true));}}@Override
    public void onEvent(int eventType, int arg1, int arg2, Bundle obj) {// 以下代码用于获取与云端的会话id,当业务出错时将会话id提供给技术支持人员,可用于查询会话日志,定位出错原因
        // 若使用本地能力,会话id为null
        // if (SpeechEvent.EVENT_SESSION_ID == eventType) {
        //    String sid = obj.getString(SpeechEvent.KEY_EVENT_SESSION_ID);
        //    Log.d(TAG, "session id =" + sid);
        // }
    }
};

6.在语音合成对应按钮的点击事件中为语音合成对象设置监听

int code = mTts.startSpeaking(text, mTtsListener);
if (code != ErrorCode.SUCCESS) {showTip("语音合成失败,错误码: " + code);
}

使用讯飞实现语音听写与语音合成功能相关推荐

  1. Android 讯飞离线语音听写/离线语音识别SDK

    平台 Android + 讯飞离线语音SDK SDK包 下载路径及方法见讯飞官方SDK文档: 离线语音听写 Android SDK 文档 # 在开发者控制台, 可以直接下载SDK. SDK包中的文件结 ...

  2. iOS语音听写、语音合成

    本文语音听写以及语音合成基于讯飞科技提供的sdk 根据官方文档,下载sdk,创建自己的应用,获取appid. sdk放进自己的工程里面,然后添加需要的库. 编译一下 ,如果编译报错,修改Targets ...

  3. Unity 讯飞实时语音转写(二)—— 接收转写结果

    目录 Unity 讯飞实时语音转写(一)-- 使用WebSocket连接讯飞语音服务器 Unity 讯飞实时语音转写(二)-- 接收转写结果 Unity 讯飞实时语音转写(三)-- 分析转写结果 正文 ...

  4. 讯飞智能语音鼠标G50:AI语音、转写翻译、记录截图一键搞定!

    随着互联网的发展,智能鼠标已经成为我们生活和工作中不可或缺的组成部分.然而,鼠标滚轮异响.按键失灵.驱动难用.手感不合适等一系列问题仍时有发生,所以选择一款智能鼠标尤为重要,它不仅可以提高我们的工作效 ...

  5. android集成科大讯飞语音听写和语音合成

    android集成科大讯飞语音听写和语音合成 集成科大讯飞语音听写和语音合成,语音听写只是语音识别下面的一部分,别弄混淆了,由于科大讯飞暂未开放gradle引包方式,所以目前集成还是手动引包.我的流程 ...

  6. 讯飞离线语音命令词识别

    讯飞离线语音命令词识别 强烈推荐 分享一个大神的人工智能教程.零基础!通俗易懂!风趣幽默!希望你也加入到人工智能的队伍中来! 网址:http://www.captainbed.net/yancyang ...

  7. Springboot实现语音听写转文字功能

    Springboot实现语音听写转文字功能 背景概述 项目描述 技术特性 技术规格 输入 输出 解决思路 源码下载 背景概述 语音识别是一门交叉学科.近二十年来,语音识别技术取得显著进步,开始从实验室 ...

  8. 讯飞智能语音先锋者:等到人机交互与人类交流一样自然时,真正的智能时代就来了...

    作者 | 夕颜 出品 | CSDN(ID:CSDNnews) 「AI 技术生态论」 人物访谈栏目是 CSDN 发起的百万人学 AI 倡议下的重要组成部分.通过对 AI 生态顶级大咖.创业者.行业 KO ...

  9. 讯飞智能语音先锋者:等到人机交互与人类交流一样自然时,真正的智能时代就来了!...

    受访者 | 刘聪 记者 | 夕颜 出品 | CSDN(ID:CSDNnews) 「AI 技术生态论」 人物访谈栏目是 CSDN 发起的百万人学 AI 倡议下的重要组成部分.通过对 AI 生态顶级大咖. ...

  10. 讯飞AIUI语音初体验

    集成SDK       近期使用科大讯飞AIUI开发一款智能语音灯控项目,因此在这记录一下我的心得,写的不好忘各位大佬见谅,不喜勿喷呐,下面就像大家介绍一下我的使用心得,注册讯飞账号,添加项目这些个常 ...

最新文章

  1. java range对象_Java LocalTime range()用法及代码示例
  2. caffe安装,编译(包括CUDA和cuDNN的安装),并训练,测试自己的数据(caffe使用教程)
  3. 重磅 | AI 圣经 PRML《模式识别与机器学习》官方开源了!
  4. 准备写一个Ibatisnet开发指南
  5. 快能通小学生计算机的游戏,亲子小游戏,帮助孩子更快学会交通安全知识
  6. 江苏省计算机学会博士论文,江苏学会网 欢迎您成为江苏省计算机学会会员
  7. TabError- inconsistent use of tabs and spaces in indentation 查验及解决方法
  8. MyEclipse 7.0 用java代码生成序列号
  9. ACL2021 | 任务型和开放域对话系统
  10. LabelImage 安装过程
  11. Linux 小程序开发日记(终章)(pyqt+yolov5)
  12. 袁春风老师:计算机系统基础(一) 第一章
  13. PYTHON对接国际验证码接口
  14. Autocad毕业设计CAD机械练习图开始发放啦!
  15. CAD手写签名是如何实现的?
  16. 花千骨html+css
  17. SCI,EI收录的中国期刊
  18. Broadcasts详解
  19. 华为最新鸿蒙消息,华为鸿蒙系统最新消息,华为鸿蒙系统2021
  20. 在线书架html代码复制,在线书架--竖黄代码

热门文章

  1. c语言资产管理系统,c语言图书资产管理系统.doc
  2. arduino 停止程序_Arduino用ISD1820语音录放模块制作留言机
  3. python适用于什么系统_Python适合在什么系统
  4. mysql 里的1对n虚线_mysql workbench EER图,里面的实线以及虚线的关系
  5. Node.js:使用session存储用户信息
  6. 科研_今天,我们怎么做科研?
  7. 论文笔记_S2D.54_2020-TIP_用于精确深度估计的无监督多视图约束卷积网络
  8. 随手记_研究生怎样做学术
  9. python数据分析之(4)读写数据文件CSV,EXCEL等
  10. K8s 使用helm 安装 EFK和ELK分布式日志分析系统系列(es版本:6.7.0;)