1、背景

公司目前有个业务使用的百度语音播报要收费了,且收费不便宜;
目前统计了线上在用的百度语音日均调用 2200+次,一年请求约 80.3W 次(后面会用到这个统计数据);

2、需求

  寻找替代方案,降低成本;

3、名词解释

  语音识别 (Automatic Speech Recognition,ASR) 将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者文本字符序列;
  语音合成(Text To Speech,TTS)将文本转化成拟人化语音,打通人机交互闭环。可以支撑多场景、多语言的音色,支持自定义音量、语速等参数。语音合成广泛适用于智能客服、有声阅读、新闻播报、人机交互等业务场景;
  语音播报 即语音合成;

4、方案调研

4.1、方案简介

方案一:百度语音合成:
  1、支持多种收费标准:按次数包预付费、按调用量后付费、并发量扩容;
  2、支持按字节、调用次数收费,支持阶梯收费; 支持http请求、java SDK调用

方案二:阿里云语音合成:
  1、这次预付费和后付费两种方式;
  2、按调用次数收费,支持阶梯收费; 支持http请求、java SDK调用

方案三:腾讯语音合成:
  1、这次预付费和后付费两种方式;
  2、按字节收费; 支持http请求、java SDK调用

方案四:科大讯飞语音合成 :
  1、按调用次数收费,按年收费; 支持http请求、java SDK调用

方案五:下载语音文件,自定义识别 免费 下载的语音文件固定,扩展性不高、后期需求变更时维护成本高

4.2、价格说明

服务商 收费标准
百度
阿里云
腾讯
科大讯飞

4.3、价格对比

4.3.1、按月调用次数预估价格

4.3.2、年预估总价

4.3.3、方案总结

服务商 结论
百度 年调用次数在1000W次以内比较划算
阿里 年调用次数大于1000W次比较划算
腾讯 按照字符收费,短文本使用比较划算(很符合我们的场景);新人注册800万免费字符,三个月内有效;
科大讯飞 按年收费,价格比较固定

4.3.4、并发限制

参考:目前百度语音日均请求 2200+ 次;

服务商 并发规则
百度 默认支持100并发,超过的部分支持付费升级:100元/路/月 或 1000元/路/年;
阿里云 默认支持200并发,超过200路并发的部分支持付费升级:100元/路/月;
腾讯 QPS限制 20次/秒;

接口效率测试(都是生成 mp3 格式文件的数据):
单线程,测试125家物流公司和0-500数字全部处理完毕(626次请求)耗时(单位:毫秒)

服务商 第一次 第二次
百度 125821 123720
阿里云 184559 191831
腾讯云 195568 190335

最后,大家根据自己的业务场景选择合适的方案吧。

PS:以上收费规则统计于 2022年05月 ,服务商随时可能会修改计费规则,本文仅供参考~

BAT(百度、阿里、腾讯)语音合成、语音播报方案调研相关推荐

  1. 科大讯飞/百度/阿里/腾讯(BAT)智能语音识别(ASR)性能对比选择预计价格分享 - pytorch中文网...

    最近在做智能客服的时候需要使用到语音识别,所以了解和对比了各家平台的语音识别对比和分析! 一.科大讯飞 1.语音听写即在线音识别查看Demo 把语音(≤60秒)转换成对应的文字信息,让机器能够&quo ...

  2. 百度阿里腾讯杀入语音识别,这家公司靠什么对抗巨头

    原标题:百度阿里腾讯杀入语音识别,这家公司靠什么对抗巨头 云知声CEO黄伟 一家语音识别的人工智能公司,想利用算法+数据,将线上和线下服务打通,押宝物联网. 撰稿|王宇寒 摄影|蒲东峰 2016年3月 ...

  3. Android自带语音播报+讯飞语音播报封装(直接用)

    一.Android自带的语音播报 1.查看是否支持中文,在测试的设备中打开'设置' -->找到 '语言和输入法'-->查看语音选项,是否支持中文,默认仅支持英文. 使用如下: public ...

  4. Android讯飞语音播报新闻

    1:讯飞开放平台注册登录:https://www.xfyun.cn/?ch=bdtg 2: 3:创建新应用获取APPID值 4:注册好就可以直接在项目中使用appid值 5:将下载的sdk中libs文 ...

  5. 万亿停车产业,只是百度阿里腾讯华为、ETCP们数字化狂欢的“前菜”

    文/智能相对论(aixdlun) 作者/陈选滨 长期以来,"停车难"都是困扰各大城市治理和民生发展的重点问题. 从三组数据来看,大抵可以简单厘清当前城市停车问题的症结. 其一,停车 ...

  6. 漫谈百度阿里腾讯三巨头基因,盈利移动未来

    http://jianshu.io/p/enyPjW本文受<冬吴相对论>启发,试图以公司基因解码百度阿里腾讯,如何在移动互联网的未来继续盈利.视角从创始人自身角度以及,公司文化环境等过去诸 ...

  7. 实现百度地图导航Demo的语音播报功能

    上文中实现了在本地导入百度地图导航Demo,那么在此基础上如何实现导航的语音播报呢? 一.为该应用申请语音播报(也叫注册) http://developer.baidu.com/map/index.p ...

  8. android 语音播报方案,Android 语音播报实现方案(无SDK)

    作者:姜康 链接:https://www.jianshu.com/p/df2022b3937d 声明:本文是 姜康 原创.转载请联系作者获得授权. 功能描述 类似支付宝收款时候的语音播报功能:当别人扫 ...

  9. 科大讯飞/百度/阿里/腾讯(BAT)智能语音识别(ASR)性能对比选择预计价格分享

    最近在做智能客服的时候需要使用到语音识别,所以了解和对比了各家平台的语音识别对比和分析! 一.科大讯飞 1.语音听写即在线音识别查看Demo 把语音(≤60秒)转换成对应的文字信息,让机器能够&quo ...

最新文章

  1. Discuz1.5 密码错误次数过多,请 15 分钟后重新登录
  2. 1.10 System类详解
  3. LeetCode 情侣牵手 (贪心)
  4. linux克隆后重新封装,克隆后立即在OSX上修改Linux内核源代码
  5. 鸿蒙霸榜 GitHub,从最初的 Plan B 到“取代 Android”?
  6. 重新拾起VS2008加入战斗
  7. shell中正则表达式详解_Shell if中的正则表达式使用详解
  8. linux 蓝牙攻击,研究人员担心BleedingTooth蓝牙漏洞给Linux系统带来风险
  9. python实例编写(7)---测试报告与测试套件(多个py文件,1个py文件内多个用例)
  10. win7 做无盘服务器配置,两种方法轻松实现无盘安装Win7系统
  11. c语言 段错误 linux
  12. win10磁盘占用率过高解决办法
  13. 开源边缘计算平台研究分析
  14. epub电子书格式转换(E-book Conversion翻译) -- calibre
  15. Kubernetes单机开发环境部署记录
  16. 随时标注各种物件,一个小标签机就能搞定,汉印M11体验
  17. “文心CV大模型” - VIMER-UFO论文报告
  18. 数据压缩算法之zigZag--一种对负数友好的编码(2000多字总结)
  19. unix/linux 经典书籍推荐
  20. 学JAVA可从事的工作岗位

热门文章

  1. java 获取文件头中的文件类型
  2. 【电气专业知识问答】问:为何直流系统要装设绝缘监察装置?如何配置?
  3. 电脑老是安装一些来路不明的软件(如何解决)?
  4. jar包修改编译反编译操作
  5. 程序员趣味儿逻辑题!5分钟出正确答案算你达标!
  6. 谷歌SEO-图片站点地图
  7. php 字符串 分割,php 分割字符
  8. OPPO A33m怎么刷机 OPPO A33m的刷机教程 OPPO A33m完美解除账号锁
  9. 数据库(5)--触发器的定义
  10. 服务器sleep时间不准校准