目录

前言

测试demo链接

讯飞集成、效果说明

有道集成、效果说明

谷歌集成、效果说明

微软集成、效果说明

总结


前言

最近在研究语音识别、合成、翻译等,由于这个玩意自己开发要消耗大量的人力和物力,之前有调研过,私有化部署至少千万起步,所以除非你们公司想专门研究语音,其它都是直接引用第三方的,在这里说明一下讯飞、微软、谷歌、有道等大厂集成效果对比,因为项目用其中某一个都满足不了条件,所以都集成了,并且封装成语音sdk,在这里只分享谷歌的demo。

测试demo链接

谷歌测试demo:需要翻墙才可以使用额

下载链接:谷歌测试demo,方便开发调试-Android文档类资源-CSDN下载谷歌测试demo,方便开发调试,具体细节可以看谷歌官方文档,里面介绍了语种以及是用方法,demo只是更多下载资源、学习资料请访问CSDN下载频道.https://download.csdn.net/download/a214024475/86504513

讯飞集成、效果说明

讯飞集成sdk路径:语音听写 Android SDK 文档 | 讯飞开放平台文档中心https://www.xfyun.cn/doc/asr/voicedictation/Android-SDK.html

优点:

讯飞中英文还是挺好的,识别速度挺快的,语音识别差不多1-2秒,语音合成1-2秒,在这里建议那种有方言要求的小伙伴优先使用这个。

缺点:

免费支持的语言太少,大部分收费有一点小贵,然后连续语音不支持,不过可以自己通过回调监听实现这种连续的效果,不过本人亲测用这种方式,让软件挂机一晚上连续开启,你会发现你的大洋瞬间就没有了。所以小伙伴们要注意了

有道集成、效果说明

有道集成sdk路径:http://ai.youdao.com/DOCSIRMA/html/语音合成TTS/Android_SDK文档/语音合成服务/语音合成服务-Android_SDK文档.htmlhttp://ai.youdao.com/DOCSIRMA/html/%E8%AF%AD%E9%9F%B3%E5%90%88%E6%88%90TTS/Android_SDK%E6%96%87%E6%A1%A3/%E8%AF%AD%E9%9F%B3%E5%90%88%E6%88%90%E6%9C%8D%E5%8A%A1/%E8%AF%AD%E9%9F%B3%E5%90%88%E6%88%90%E6%9C%8D%E5%8A%A1-Android_SDK%E6%96%87%E6%A1%A3.html

优点:支持的国家挺多,新用户有50的体验金,感觉测试的时候用得飞快,语音识别速度-3秒左右,合成根据文字长短,短的挺快的差不多2-3秒,长的差不多-5秒左右

缺点:文档不是很完善,很多东西体现不出来

谷歌集成、效果说明

微软集成sdk路径:https://cloud.google.com/speech-to-text/docs/samples?hl=zh-cnhttps://cloud.google.com/speech-to-text/docs/samples?hl=zh-cn

语言支持查看:https://cloud.google.com/speech-to-text?hl=zh-cnhttps://cloud.google.com/speech-to-text?hl=zh-cn

优点:支持的国家丰富,也支持一些少数民族

缺点:国内需要翻墙才可以调用,解决办法就是开一个转接服务器可以解决翻墙的问题,联系不上开发,完全只能自己看文档操作。

微软集成、效果说明

优点:微软分为国内和国外,建议用国内的请求速度要快一些,这里讲一下国内的合成速度,合成大概是2秒左右,识别3秒左右,网络正常的情况下。

语言支持查看:语言支持 - 语音服务 - Azure Cognitive Services | Microsoft Docs语音服务支持多种语言,可用于语音到文本和文本到语音转换,以及语音翻译。 本文提供了按服务功能列出的语言支持的完整列表。https://docs.microsoft.com/zh-cn/azure/cognitive-services/speech-service/language-support?tabs=speechtotext

缺点:语音识别不支持端点设置、不支持音频默认存储,翻译太依赖dns解析了,当dns乱码的时候,有网络翻译也不行。

总结

由于我们公司最近在研究语音方面的,花了一段时间开发语音sdk,从目前测试来看,每个厂家都有各自的一些优势吧,谷歌的还不错,不过需要翻墙

讯飞、有道、谷歌、微软语音sdk集成总结相关推荐

  1. 讯飞语音SDK集成调试常见问题

    问题一:启动录音失败 20006 这个问题是由于应用程序未获取到录音,语音等权限导致的. 可以将demo中manifest文件里的权限复制到自己的app程序里,一般都可以解决. 问题二:创建失败,请确 ...

  2. Unity XCode交互(unity调用讯飞的AIUI技能ios的sdk)

    最近要做ios的讯飞语音(aiui技能) 文章目录 前言 一.讯飞项目 二.XCode 1. 2.设置AIUI 2.创建AIUI 3.唤醒,录音,停止录音AIUI,文本写入 4.AIUI数据监听 5. ...

  3. 讯飞语音识别_讯飞输入法持续功能创新 语音输入最受用户认可

    犹记得10多年前功能机上的输入法,无论是拼音还是笔画,通过物理键盘按部就班地进行输入,效率异常低下:所幸那时候网络没有那么发达.手机聊天应用并不怎么丰富,而且彼时手机还只是"通讯设备&quo ...

  4. html调用讯飞语音文本朗读,(原创)讯飞输入法的妙用:语音翻译+智能OCR + 文本转语音播报...

    重点: 语音翻译在第二,第三页: OCR: 也就是图片直接转文本的功能介绍在第三,第四页: 把转出来的文本直接朗读,并且配上背景音乐的介绍在第八页 - 第十二页: 前几年有人问我手机上有没有那种可以读 ...

  5. Android 科大讯飞语音SDK集成步骤

    前言 科大讯飞语音虽好,其严格的认证与校验确实精密,不过也大大提高了开发者的集成难度,并非危言耸听,我想大多数人都有经历过 11210(用户ID与离线资源不匹配) 21480( 离线引擎GUID不一致 ...

  6. 百度AI语音SDK集成

    异常 1.报错[ERROR]asr error:{"sub_error":4004,"error":4,"origin_result":{& ...

  7. 集成讯飞SDK,实现离线命令词、离线语音合成、离线唤醒,语音在线/离线听写

    关于讯飞开发平台的注册以及SDK下载:## ##请参考: http://blog.csdn.net/weixin_39923324/article/details/78924892 强烈推荐 分享一个 ...

  8. 讯飞语音--唤醒Demo

    写的第一篇博客,因为最近姐姐说起了一个段子, 一男子在地铁站手机找不到了,但是带了蓝牙耳机,耳机还有内容,男子想手机一定还在附近,随即大喊一句,悟空你在哪儿, 手机循环回答,我在这.....这时,拿手 ...

  9. 讯飞输入法PC版测评:拼音输入糟糕,语音输入强悍

    其实我手机用的就是讯飞输入法,它的语音输入和手写输入确实很爽. 最近有朋友在我的文章后面留言说,讯飞也有电脑版,于是去了讯飞主页下载安装试用了一回. 在太平洋下载站,关于讯飞输入法PC版的介绍是这样的 ...

  10. android 讯飞语音评测,非同凡响的语音输入法——讯飞Android输入法评测

    Android平台上的输入法实在是多得数不过来了,除了谷歌官方的输入法,还有老牌的搜狗等输入法以及后来的百度输入法等同样也在移动平台上大放异彩,可以说,如果再有人去开发输入法,如果不做出点差异化,那么 ...

最新文章

  1. Linux sed替换内容中有空格解决办法
  2. Wooden Sticks POJ - 1065(最大上升子序列+动态规划状态转移思维)
  3. 大数据开发者应该知道的分布式系统 CAP 理论
  4. JAVA不同类型数组重载_JAVA补课-DAY1:方法重载和数组
  5. 2020年 2 篇异常算法最佳综述
  6. 项目管理综述(需要完善)
  7. Windows python tensorflow 安装
  8. 计算机信息管理系统设计原理探究,计算机信息管理系统设计原理探究
  9. loading动画_超级简单的CSS加载动画(冰淇淋loading加载动画)
  10. 如何安装和_彻底卸载MySQL
  11. PostgreSQL在何处处理 sql查询之二十五
  12. 【LBS】高德地图、百度地图的经纬度科普|MySQL和编程语言是如何计算两个坐标之间的距离?
  13. ubuntu20磁盘新建分区与挂载
  14. 提升营业额的正确方法
  15. 解决16G(或者8G)U盘格式化后变为15M的问题
  16. isis和ospf比较
  17. SDN相关组织——ONF
  18. ASCII、Unicode、UTF-8
  19. Java实现 LeetCode 507 完美数
  20. python顺序结构例题_python的顺序结构、选择结构、循环结构的练习代码

热门文章

  1. 简单制作一个百度注册页面
  2. python2.7安装mysqldb_python2.7安装MySQLdb库
  3. 【83行代码获奖代码】高中生@青藤木子 耗费一周给妈妈编写了一款语音识别APP
  4. mysql 里 CST 时区的坑
  5. 【android】项目案例(二)之京东客户端
  6. 【异常检测】【SPADE】论文简单梳理与代码实现
  7. blender弯曲物体
  8. 数据库统计函数 COUNT
  9. 关于hping打流测试工具
  10. opensuse15.0测试使用snapper