google sdk speech-to-text

  • 同步识别(REST 和 gRPC)将音频数据发送到 Speech-to-Text API,对该数据执行识别,并在所有音频处理完毕后返回结果。同步识别请求仅限于持续时间不超过 1 分钟的音频数据。

  • 异步识别(REST 和 gRPC)将音频数据发送到 Speech-to-Text API 并启动长时间运行的操作。使用此操作,您可以定期轮询识别结果。异步请求可用于任何持续时间不超过 180 分钟的音频数据。

  • 流式识别(仅限 gRPC)对 gRPC 双向流内提供的音频数据执行识别。流式传输请求专为实时识别(例如从麦克风采集实时音频)而设计。流式识别可以一边采集音频一边提供临时结果,例如实现在用户仍在讲话时显示结果。

源码

  • https://github.com/opensourceteams/google-sdk-speech-to-text

识别率超高的在线麦克风语音转文本(免费工具)

  • https://www.speechtexter.com

官网文档

  • https://cloud.google.com/speech-to-text/docs/quickstart-client-libraries#client-libraries-usage-java

Java 流式和非流式语音识别示例(官网示例)

  • https://github.com/GoogleCloudPlatform/java-docs-samples
  • https://github.com/GoogleCloudPlatform/java-docs-samples/tree/master/speech

google speech-to-text

  • https://github.com/opensourceteams/google-sdk-speech-to-text/blob/master/md/languages.md

google 语音转文本(短语音)

  • https://github.com/opensourceteams/google-sdk-speech-to-text/blob/master/md/speech-text.md

google 语音转文本(英文短语音)

  • https://github.com/opensourceteams/google-sdk-speech-to-text/blob/master/md/speech-text-english.md

google 语音转文本(异步短语音)

  • https://github.com/opensourceteams/google-sdk-speech-to-text/blob/master/md/speech-text-async.md

google 语音转文本(每个单词带时间戳)

  • https://github.com/opensourceteams/google-sdk-speech-to-text/blob/master/md/speech-text-time.md

google 语音转文本自动加标点符号(短语音)

  • https://github.com/opensourceteams/google-sdk-speech-to-text/blob/master/md/Google_Gnome.wav

google 通过流的方式发送语音文件转文本

  • https://github.com/opensourceteams/google-sdk-speech-to-text/blob/master/md/speech-text-steam.md

google 通过流的方式发送语音(直接用电脑上的麦克风说话)

  • https://github.com/opensourceteams/google-sdk-speech-to-text/blob/master/md/speech-text-micsteam.md

google 语音转文本(多轨支持)

  • https://github.com/opensourceteams/google-sdk-speech-to-text/blob/master/md/speech-text-multiChannel.md

Google Speech 多语言支持

  • https://github.com/opensourceteams/google-sdk-speech-to-text/blob/master/md/speech-text-multiLanguage.md

google sdk speech-to-text(谷歌语音转文本、谷歌语音转字幕)相关推荐

  1. python视频处理转语音_文本转语音(普通话粤语)_Python视频剪辑自动化

    利用百度翻译接口, 实现文本转语音 now you see me now you see me now you see me now you see me now you see me now you ...

  2. 免费视频转文字-音频转文字软件:网易见外工作台, Speechnotes, autosub, Speech to Text, 百度语音识别

    文章目录 网易见外工作台(推荐) Chrome插件 Speechnotes autosub 百度语音识别API IBM的Speech to Text(不推荐) 此文首发于我的Jekyll博客:zhan ...

  3. 开源(离线)中文语音识别ASR(语音转文本)工具整理

    开源(离线)中文语音识别ASR(语音转文本)工具整理 目录 文章目录 目录 @[toc] open ai 的开源工具:whisper whisper介绍 引用 ASRT语音识别项目 ASRT介绍 引用 ...

  4. python实现文字转语音_利用python实现自己的文本转语音

    1.安装python3.8.5 python   >>  downloads   >>   windows    >>  Windows x86-64 execut ...

  5. 【Google语音转文字】Speech to Text 超级好用的语音转文本API

    前面有一篇博客说到了讯飞输入法,支持语音输入,也支持电脑内部音源输入,详细参考:[实时语音转文本]PC端实时语音转文本(麦克风外音&系统内部音源) 但是它只是作为一个工具来使用,如果我们想自己 ...

  6. 微软文本转语音小工具(Text to speech)网页版

    之前在52破解上看到有人发布了一个文本转语音的小软件,使用微软提供的免费的文本转语音接口,自己闲着没事做了一个网页版的,用php调用微软接口生成语音.感兴趣的同学可以看下. 地址:www.text-t ...

  7. 基于Google的嵌入式系统android开发语音技术(语音搜索,语音朗读文章,语音控制)

    android是Google推出的嵌入式操作系统,有着广泛的根基与基础.最近一个中关村的一个CEO朋友送了一个摩托罗拉android手机,想玩玩语音技术过把瘾.如何用android开发语音技术应用呢, ...

  8. 使用 JavaScript 进行单词发音 Use JavaScript to Speech Your Text

    在w3c草案中增加了对Web Speech Api的支持;主要作用在 两个非常重要的方面: 语音识别 (将所说的转换成文本文字 / speech to text); 语音合成 (将文本文字读出来 / ...

  9. 通用联手谷歌,应用程序和语音助手将整合到车辆中

    一旦Google Assistant被整合到通用的汽车上,车辆新的信息娱乐系统将会是什么样子? 从2021年开始,通用将联手谷歌在车辆上安装语音助手和应用程序,包括谷歌地图.合作并非独家,新系统产生的 ...

最新文章

  1. 3.Linux 文件的压缩与打包
  2. P4062 [Code+#1]Yazid 的新生舞会 树状数组维护三阶差分
  3. 重庆高考计算机分数线,重庆高考历年分数线
  4. python编写字符串查找函数_Python 简明教程 --- 8,Python 字符串函数
  5. loadClass 使用
  6. OpenCV——SURF特征检测、匹配与对象查找
  7. 2021年电工杯B题附代码、附论文——光伏建筑一体化板块指数发展趋势分析及预测
  8. 如何优化项目进度管理
  9. 关于NI美国国家仪器音频分析器使用技巧(4461音频分析仪)
  10. 提供多种版本- MSI Code条形码字体具有可扩充性条形码控件MSI Plessey
  11. 阿里百川HotFix的使用
  12. 传神语联再度冲刺科创板:2020年业绩大幅下滑,本质为中介公司?
  13. C# 日期插入access数据库
  14. Linux-启动和服务(service)
  15. Android隐藏应用程序的图标
  16. android app防止锁屏_android 屏幕保持不锁屏的实现方式
  17. 日常工作要想有效提高工作效率 常用的在线工具网站
  18. 【开源日记】宿舍断电自动关灯设备(二)
  19. 运动助手卡密增加了,周卡来领取!
  20. Python 爬虫入门(二)—— IP代理使用 - 不剃头的一休哥 - 博客园

热门文章

  1. 什么是信贷风险控制?
  2. 基于clamp.js封装vue指令,处理多行文本的溢出
  3. MAC剪切板神器 —— Paste
  4. setuid函数解析
  5. 只是浅谈MS SQL Server的Page Splits运作原理
  6. TCP/IP协议头部结构
  7. 看板 工具_2019年14种最佳看板工具
  8. 【高项备考】多种类型计算题学习
  9. vbox android wifi,virtualbox桥接无线网卡实现上网
  10. 贝叶斯统计之三种信息