一、视频转文本

肯定会有其他方便的转换行为或软件，这里只提供目前使用过的方法。

1、使用格式工厂，转换视频为MP3。

2、使用二、语音转文本。

二、语音转文本

1、打开讯飞开放平台，注册账号

2、打开语音转写接口介绍页

3、点击免费使用→上传身份证正反面实名注册→领取新用户礼包（个人开发者和企业开发者免费使用）,可领到语音转写5小时、极速语音转写10小时，有效期1年。

4、打开语义转写服务管理页，复制你的APPID和SecretKey，粘贴到到下列Java（或Python代码）中的对应变值。

注: demo只是一个简单的调用示例，不适合直接放在复杂多变的生产环境使用

语音转写demo python3语言

语音转写demo java语言

语音转写demo nodejs语言

语音转写demo php语言

5、运行Java项目中的WeblfasrDemo.java类，等待分片上传语音文件、转写等待、返回JSON字符串数据。

6、把控制台打印的JSON数组字符串，复制到下面代码的json变量中，执行main方法，完成处理返回的JSON字符串，保存到txt文件。

没有把下面这个代码直接集成到样例项目里。操作步骤可合并。

package com.iflytek.voicecloud.lfasr.demo;import com.alibaba.fastjson.JSONArray;
import com.alibaba.fastjson.JSONObject;import java.io.File;
import java.io.FileOutputStream;
import java.io.IOException;
import java.nio.charset.StandardCharsets;public class JSONToFile {public static void main(String[] args) {// 把控制台打印的JSON数组字符串复制到这里String json = "[{\"bg\":\"1342490\",\"ed\":\"1345720\",\"onebest\":\"和债务可持续原则的这样一个多元化的投融资体系。\",\"speaker\":\"0\"}]";// 解析onebest中的文本String text = getText(json);// 保存到文件saveKeyToFile(text, System.getProperty("user.dir") + File.separator + "text" + File.separator + "d1.txt");}public static String getText(String json) {StringBuilder builder = new StringBuilder();JSONArray array = (JSONArray) JSONObject.parse(json);for (Object object : array) {JSONObject obj = (JSONObject) object;builder.append(obj.get("onebest"));builder.append("\n");}return builder.toString();}public static void saveKeyToFile(String content, String filePath) {try (FileOutputStream fos = new FileOutputStream(filePath)) {fos.write(content.getBytes(StandardCharsets.UTF_8));} catch (IOException e) {throw new RuntimeException(e);}}
}

02 视频或语音转文本相关推荐

【Google语音转文字】Speech to Text 超级好用的语音转文本API
前面有一篇博客说到了讯飞输入法,支持语音输入,也支持电脑内部音源输入,详细参考:[实时语音转文本]PC端实时语音转文本(麦克风外音&系统内部音源) 但是它只是作为一个工具来使用,如果我们想自己 ...
《AI上字幕》基于openAI研发的whisper模型，语音（视频）一键转文本/字幕/带时间轴/支持多语言/自带翻译《桌面版教程》
简介: OpenAI的chatGPT非常火爆,其实OpenAI旗下的另一个模型实力也十分强大,它就是开源免费的Whisper语音转文本模型,目前为止它是较为顶尖的语音转文本模型当前github上也有 ...
Python爬虫新手进阶版：怎样读取非结构化网页、图像、视频、语音数据
导读:常见的数据来源和获取方式,你或许已经了解很多.本文将拓展数据来源方式和格式的获取,主要集中在非结构化的网页.图像.视频和语音. 01 从网页中爬取运营数据要从网页中爬虫数据,可使用Python ...
人脑启发AI设计：让神经网络统一翻译语音和文本
来源:图灵人工智能作者:Glaciohound 编辑:陈彩娴能够统一地理解语音和文本,是人类能够形成通用语言能力的重要原因.那么,人工智能是否也能如此?最近,来自字节跳动和UIUC的研究人员借鉴这 ...
900万注释图像数据集升级了！谷歌开放Open Images V6，首增语音、文本、鼠标轨迹同步注释...
点击我爱计算机视觉标星,更快获取CVML新技术本文转自量子位. 鱼羊发自云凹非寺量子位报道 | 公众号 QbitAI 谷歌的900万注释图像数据集Open Images,再次进化. 这一次的 ...
RapidASR项目(语音转文本)：更快、更容易部署、开箱即用
引言本人就是该项目的贡献者之一!!! 目前在语音转文本的开源项目中,wenet算是其中翘楚,虽说在wenet repo下的README中写的是: WeNet 是一款面向工业落地应用的语音识别工具包, ...
基于ASRT的开源实时语音转文本
基于ASRT的开源实时语音转文本文章目录基于ASRT的开源实时语音转文本 ASRT语音识别系统相关资料实时转写客户端识别效果 ASRT语音识别系统相关资料 ASRT是AI柠檬博主(西安电子科技 ...
Premiere Pro 2022带来离线语音转文本教程
Premiere Pro 2022大版本更新,在去年的的10月份更新也带来了不少实用功能.今日小编就为大家带来 Premiere Pro 2022 离线语音转文本教程.感兴趣的小伙伴们欢迎收藏! Ad ...
Premiere Pro 2022离线语音转文本教程
Premiere Pro 2022大版本更新,在去年的的10月份更新也带来了不少实用功能.今日小编就为大家带来 Premiere Pro 2022 离线语音转文本教程.感兴趣的小伙伴们欢迎收藏!pre ...

02 视频或语音转文本

一、视频转文本

二、语音转文本

02 视频或语音转文本相关推荐

最新文章

热门文章