最近在做智能客服的时候需要使用到语音识别,所以了解和对比了各家平台的语音识别对比和分析!

一、科大讯飞

1、语音听写即在线音识别查看Demo

把语音(≤60秒)转换成对应的文字信息,让机器能够“听懂”人类语言,相当于给机器安装上“耳朵”,使其具备“能听”的功能

可以识别多种方言,识别率高

支持Android,iOS,Windows,Java,Linux

2、语音转写即长语音识别查看Demo

语音转写(Long Form ASR)基于深度全序列卷积神经网络,将长段音频(5小时以内)数据转换成文本数据,为信息处理和数据挖掘提供基础

支持标准版/电话专用版,可以单声道&多声道,返回json格式

价格范围为4.9~9.9元/小时,提供5小时免费使用

3、实时语音转写查看Demo

实时语音转写(Real-time ASR)基于深度全序列卷积神经网络框架,通过 WebSocket 协议,建立应用与语言转写核心引擎的长连接,将音频流数据实时转换成文字流数据结果

WebSocket形式输入PCM实时音频流,导出json格式数据

价格为2万元/路/年,新用户免费限时使用。

二、阿里语音识别

阿里云语音识别为智能语音交互2.0,价格有免费和付费版本,免费版本最大并发为10,商务专用版 最大为200/100两个并发,也可以按量付费。参考阿里语音识别报价

电联客服,告知每小时价格为3.5,超过900小时为3块,每条线路分开计时,即100条线路每天打8小时为800小时,需要支付2800元RMB

1、录音文件识别即长语音识别

目前未上架,官方提供了排期

2、实时语音识别

对长时间的语音数据流进行识别,适用于会议演讲、视频直播等长时间不间断识别的场景。支持PCM、OPU音频编码格式,支持Java,C++,iOS,Android;流程为先推送申请指令,然后实时传递语音流,然后发送结束指令。

3、一句话识别

对一分钟内的短语音进行识别,适用于对话聊天,控制口令等较短的语音识别场景。支持音频编码格式:PCM、OPUS、OPU,支持Java,C++,iOS,Android语言。其实是API模式,所有语言都支持。

三、百度语音

百度语音目前只支持语音识别,语音合成和语音唤醒,支持pcm wav amr三种格式,时长为60秒以内,价格为完全免费,调用量限制为无限制,文档地址百度语音

1、离线语音识别

百度离线语音识别目前只支持Android和IOS,Android 平台的一体化离在线语音识别解决方案,以JAR包 + SO库的形式发布。IOS移动设备的离在线语音识别解决方案,以静态库方式提供。

2、在线语音识别

通过API格式调用,支持Android,iOS,C#,Java,Node,PHP,Python,C++语言,其实是API模式,所有开发语言都支持

支持普通话,英语,粤语,四川话,普通话远场

四、腾讯云语言识别

目前价格需要手动提交申请然后会给你推送报价,不对外提供报价(客服电话告诉我的),文档地址腾讯云语言识别

1、一句话识别即在线识别

识别60s内的短语音,当音频放在请求body中传输时整个请求大小不能超过1M,当音频以url方式传输时,音频时长不可超过60s。接口请求频率限制:20次/每秒

2、离线语音识别(RESTful API)

离线语音识别服务使用 RESTful API 识别语音文件,采用异步方式通知业务方全部文本结果。离线语音识别接口采用 HTTPS 协议,支持语音 URL 和本地语音文件两种请求方式。离线语音识别适用于多种标准语音格式的长段语音文件,通常应用于对识别结果返回时延要求不高的场景。目前支持的采样率为 8K 和 16K,仅支持中文。可以应用于客服语音记录质检、UGC 音频审核、会议语音记录转写和医生就诊录音转写等场景。

识别分为推送和获取识别结果两个步骤

支持长语音识别

五、总结

目前来看科大讯飞的产品比较完善,但是相比收费也是最高的,其次阿里相对比较完善,不过要线上使用相比价格还是比较高的,百度完全免费,不过只支持60秒以内识别,其次腾讯只支持两种模式识别。相比之下我在智能通话中会使用科大和阿里的在线识别,其次在语音质检过程中我会使用百度的识别,因为一般录音文件少于60秒(语音告知),如果超过部分可以提供剪裁!

原创文章,转载请注明 :科大讯飞/百度/阿里/腾讯(BAT)智能语音识别(ASR)性能对比选择预计价格分享 - pytorch中文网

原文出处: https://ptorch.com/news/192.html

问题交流群 :168117787

科大讯飞/百度/阿里/腾讯(BAT)智能语音识别(ASR)性能对比选择预计价格分享 - pytorch中文网...相关推荐

  1. 科大讯飞/百度/阿里/腾讯(BAT)智能语音识别(ASR)性能对比选择预计价格分享

    最近在做智能客服的时候需要使用到语音识别,所以了解和对比了各家平台的语音识别对比和分析! 一.科大讯飞 1.语音听写即在线音识别查看Demo 把语音(≤60秒)转换成对应的文字信息,让机器能够&quo ...

  2. 百度 阿里 腾讯 BAT笔试题目

     8月15日,百度2道面试题: 1.来自<编程之美>的概率题:一个桶里面有白球.黑球各100个,现在按下述规则取球:的     i .每次从通里面拿出来两个球:     ii.如果取出 ...

  3. 百度阿里腾讯杀入语音识别,这家公司靠什么对抗巨头

    原标题:百度阿里腾讯杀入语音识别,这家公司靠什么对抗巨头 云知声CEO黄伟 一家语音识别的人工智能公司,想利用算法+数据,将线上和线下服务打通,押宝物联网. 撰稿|王宇寒 摄影|蒲东峰 2016年3月 ...

  4. 万亿停车产业,只是百度阿里腾讯华为、ETCP们数字化狂欢的“前菜”

    文/智能相对论(aixdlun) 作者/陈选滨 长期以来,"停车难"都是困扰各大城市治理和民生发展的重点问题. 从三组数据来看,大抵可以简单厘清当前城市停车问题的症结. 其一,停车 ...

  5. 漫谈百度阿里腾讯三巨头基因,盈利移动未来

    http://jianshu.io/p/enyPjW本文受<冬吴相对论>启发,试图以公司基因解码百度阿里腾讯,如何在移动互联网的未来继续盈利.视角从创始人自身角度以及,公司文化环境等过去诸 ...

  6. 嵌入式设备开发专题《踩坑篇,ESP32对接腾讯云叮当语音识别ASR出现偶发性签名错误问题》

    腾讯云叮当语音识别ASR平台链接:https://dingdang.qq.com/doc.html?dir=/doc/tvs/cloud/api.html 对接腾讯云叮当语音识别ASR平台过程中,出现 ...

  7. 智能语音识别ASR工具Riva简介

    一:前言 本手册主要以NVIDIA Riva官方文档为依据进行中文翻译,旨在帮助中国开发者了解和学习Riva,并加入译者对Riva的理解进行分享,本手册将以连载的方式持续进行更新. 二:Riva概述 ...

  8. 百度+阿里+腾讯+笔试题目(2020届)

    百度度秘事业部 百度是我第一家面试的公司,而且还是bat的大厂级别,那时的我也不知道自己啥水平,接到面试电话慌的不行,面试第一次非常难忘.下午3点,面试40分钟! 百度一面: 1.实验室项目里面使用什 ...

  9. 去百度/阿里/腾讯…做测试的,都是什么样的人?

    测试这条路上其实有不少一路"躺赢"的同学,拿着offer功成身退.但是! 也有很多测试小伙伴频频反映:找工作很难,特别是进大一点的厂!他们特别挑!!! 而去百度.阿里.腾讯--等顶 ...

最新文章

  1. 【Java8新特性】浅谈方法引用和构造器引用
  2. 如何在 Microsoft Visual C# .NET 中实现 Microsoft Excel 自动化
  3. 前端JavaScripts
  4. 拓扑排序——最大食物链计数(洛谷 P4017)
  5. 移动应用后端应该使用 AWS 还是 Firebase?
  6. 应用安全-软件安全-漏洞CVE整理
  7. junit搭配hamcrest使用
  8. [2018.10.25 T1] 妹子
  9. 关于移动端video-player点击播放自动全屏
  10. Excel实用技巧辞典 01
  11. java基础视频教程 学习笔记
  12. 数据科学和机器学习中的优化理论与算法(下)
  13. JDBC学习总结及复习笔记(附MySQL驱动和JDK-API中文版)
  14. MOOS通信框架初探(一)
  15. 曲面的渐近方向和共轭方向、主方向、曲率线网
  16. 在计算机软件中怎么拍照,计算机相机相机软件,这三个软件不仅用于拍照
  17. C语言顺序结构(解决二元一次方程)
  18. HM二次开发 - 外部程序采用socket与HM实现通信
  19. 牛客国庆集训派对Day1 C-Utawarerumono(扩展欧几里得)
  20. 用余下的青春尽力飞翔

热门文章

  1. 认识Python基础环境搭建
  2. ajax的两个重要参数contentType 和dataType
  3. C#多屏幕显示器编程
  4. 我的大学——不忍舍弃的回忆(3)
  5. HDU2151 Worm【DP】
  6. UVA12416 Excessive Space Remover【对数+字符流】
  7. I00004 贝尔三角形(解法二)
  8. eclipse 环境 JUnit 测试框架(junit.framework.* 与 org.junit.*)
  9. matlab 格式化文本文件的解析
  10. word 软换行与硬换行