音频文件转文本 web-API
这里讲把音频文件转为文字的服务,不是实时识别的那种。
中文
- 目前只找到付费的讯飞听见比较靠谱,准确率挺高,转写也挺快,免费送两小时。另外手机上的录音宝App也是科大讯飞的,与讯飞听见类似。
- 最近发现autosub不错,利用Google Web Speech API,免费生成SRT字幕,而且速度挺快,两个小时的音频几分钟就转换好了,目前支持90多种语言。 有一点要注意的是如果音频语言不是英语,Source Language和Destination Language都要注明。如果只注明Souce Language的话,当进度100%,你以为转换好了时,会出现Error问你要Google Translate API key(因为它要用Google Translate API翻译成英文)。 这里有个Windows里使用的教程,以及视频版。
英文
推荐用YouTube自动识别服务,准确率还可以,不过得等一会儿(根据音频时长大概15分钟至几小时吧,偶尔也会有几天才转好的情况)。具体方法可以看这篇文章。
另外IBM Watson的Speech to Text感觉识别准确率比较差,不过支持API,可以嵌入到代码中(也支持中文)。
另外Voicebase注册送接近20小时的转写服务,还没体验过不知服务咋样。使用方法可看这篇文章。
讯飞听见最近推出了转写英文的服务,每天有300个名额可以免费转两段一小时的音频,试用了下效果还不错。
百度最近推出了SwiftScribe可以转写英文,不过还是beta版本要申请了才能用。
音频文件转文本 web-API相关推荐
- 用Python将音频内容转换为文本格式
当对一个或多个人的谈话进行记录时,采用一种高度准确和自动化的方式将口语提取为文本非常有用.转换成文字后,便可以将其用于进一步分析或用作其他功能. 很多人学习python,不知道从何学起. 很多人学习p ...
- 用 Python 将音频内容转换为文本格式
当对一个或多个人的谈话进行记录时,采用一种高度准确和自动化的方式将口语提取为文本非常有用.转换成文字后,便可以将其用于进一步分析或用作其他功能. 在本教程中,我们将使用称为AssemblyAI(htt ...
- python将音频转换成文字_用Python将音频内容转换为文本格式,方言可以吗?
当对一个或多个人的谈话进行记录时,采用一种高度准确和自动化的方式将口语提取为文本非常有用.转换成文字后,便可以将其用于进一步分析或用作其他功能. 在本教程中,我们将使用称为AssemblyAI(htt ...
- .NET Core Web API:您需要了解的最少知识(第1部分,共2部分)
目录 背景 本文涵盖的内容 介绍 创建新项目 将创建一个新文件夹 运行Web API项目 只是生成项目 实际使用中的Web API 一个通过Get的Web API方法 Visual Studio Co ...
- 生成用于ASP.NET Web API的TypeScript客户端API
目录 介绍 备注 背景 推定(Presumptions) 使用代码 步骤0:将NuGet package WebApiClientGen和WebApiClientGen.jQuery安装到Web AP ...
- 用ASP.NET Web API技术开发HTTP接口(一)
<转载自 "浮点指向"> 启动Visual Studio 2015,新建一个ASP.NET Web应用程序,命名为SimpleAPI.选择Empty模板,并勾选&quo ...
- 解答网友提问 | 使用VS2022快速生成React/Angular/Vue.js + Web API前后端集成项目
前言 上次发表了<一键生成Vue.js + Web API前后端集成项目>后,有多位网友来问,有不有其他的前后端集成模板: 实际上,VS2022没有提供前后端集成项目模板. 但是,使用VS ...
- python构建聊天机器人之录制声音保存为音频文件(利用pyaudio进行录音)
最近心血来潮想利用 python构建一个智能语音聊天机器人,这样就能在我们无聊的时候和我们聊天以此打发时间啦:). 要想最终实现聊天机器人的构建需要经过一系列过程功能的实现,大致思路为程序接受用户的语 ...
- 网络知识入门,Web服务器的CGI程序,浏览器如何判断响应内容:文本,图片还是音频文件?(十九)
目录 将请求的uri转换为实际的文件名 运行CGI程序 web服务器的访问控制 浏览器接受响应并返回内容 浏览器接受响应消息后如何显示内容 浏览器显示网页内容:访问完成 将请求的uri转换为实际的文件 ...
最新文章
- LINQ to SQL语句(4)之Join
- 验证Linux主机是否支持RDMA
- SELinux 入门
- Android应用程序运行方式以及优先级
- SQLServer镜像状态异常排查
- (部分来自windows核心编程)远程注入dll
- 你跟最伟大领导的距离,或许只差这一点
- rmlv出错处理一例
- 红外报警c语言,基于单片机的红外报警系统设计 (毕业论文).docx
- php整么去掉时间的年月日,php强大的时间转换函数strtotime
- dlink虚拟服务器端口转发,D-Link路由器端口转发怎么设置【图文教程】
- RFID全面梳理(超高频)
- 数据分析: 线性回归分析之研究二手房价的影响因素,建立房价预测模型
- 网易公开课与网易云课堂的区别
- Promethues (普罗米修斯)详细介绍
- 国内安卓渠道列表42个
- 一点点读懂regulator(四)
- php yar 安装失败_php 安装yar扩展
- Linux下优雅的让程序后台运行
- 【已解决】华为P10禁止系统更新EMUI9
热门文章
- 金融壹账通“壹账通记忆增强网络”获对话系统学术竞赛佳绩
- 富文本对比算法的java实现源码,实现类似word修订记录功能
- MS-DOS批处理指令学习--time、date、cls、title、color、winver、calc、notepad、edit、mspaint
- Intellij IDEA打jar包方式
- Python MySQL数据库交互
- 使用python连接mysql数据库
- 相机标定--内参之绝对圆锥曲线
- 2019暨南大学计算机技术考研,2019年暨南大学计算机技术考研参考书目
- css html自定义属性,是时候开始用 CSS 自定义属性了
- 用WPF窗体打造个性化界面的图片浏览器