02 视频或语音转文本
一、视频转文本
肯定会有其他方便的转换行为或软件,这里只提供目前使用过的方法。
1、使用格式工厂,转换视频为MP3。
2、使用二、语音转文本。
二、语音转文本
1、打开讯飞开放平台,注册账号
2、打开语音转写接口介绍页
3、点击免费使用→上传身份证正反面实名注册→领取新用户礼包(个人开发者和企业开发者免费使用),可领到语音转写5小时、极速语音转写10小时,有效期1年。
4、打开语义转写服务管理页,复制你的APPID和SecretKey,粘贴到到下列Java(或Python代码)中的对应变值。
注: demo只是一个简单的调用示例,不适合直接放在复杂多变的生产环境使用
语音转写demo python3语言
语音转写demo java语言
语音转写demo nodejs语言
语音转写demo php语言
5、运行Java项目中的WeblfasrDemo.java类,等待分片上传语音文件、转写等待、返回JSON字符串数据。
6、把控制台打印的JSON数组字符串,复制到下面代码的json变量中,执行main方法,完成处理返回的JSON字符串,保存到txt文件。
没有把下面这个代码直接集成到样例项目里。操作步骤可合并。
package com.iflytek.voicecloud.lfasr.demo;import com.alibaba.fastjson.JSONArray;
import com.alibaba.fastjson.JSONObject;import java.io.File;
import java.io.FileOutputStream;
import java.io.IOException;
import java.nio.charset.StandardCharsets;public class JSONToFile {public static void main(String[] args) {// 把控制台打印的JSON数组字符串复制到这里String json = "[{\"bg\":\"1342490\",\"ed\":\"1345720\",\"onebest\":\"和债务可持续原则的这样一个多元化的投融资体系。\",\"speaker\":\"0\"}]";// 解析onebest中的文本String text = getText(json);// 保存到文件saveKeyToFile(text, System.getProperty("user.dir") + File.separator + "text" + File.separator + "d1.txt");}public static String getText(String json) {StringBuilder builder = new StringBuilder();JSONArray array = (JSONArray) JSONObject.parse(json);for (Object object : array) {JSONObject obj = (JSONObject) object;builder.append(obj.get("onebest"));builder.append("\n");}return builder.toString();}public static void saveKeyToFile(String content, String filePath) {try (FileOutputStream fos = new FileOutputStream(filePath)) {fos.write(content.getBytes(StandardCharsets.UTF_8));} catch (IOException e) {throw new RuntimeException(e);}}
}
02 视频或语音转文本相关推荐
- 【Google语音转文字】Speech to Text 超级好用的语音转文本API
前面有一篇博客说到了讯飞输入法,支持语音输入,也支持电脑内部音源输入,详细参考:[实时语音转文本]PC端实时语音转文本(麦克风外音&系统内部音源) 但是它只是作为一个工具来使用,如果我们想自己 ...
- 《AI上字幕》基于openAI研发的whisper模型,语音(视频)一键转文本/字幕/带时间轴/支持多语言/自带翻译《桌面版教程》
简介: OpenAI的chatGPT非常火爆,其实OpenAI旗下的另一个模型实力也十分强大,它就是开源免费的Whisper语音转文本模型,目前为止它是较为顶尖的语音转文本模型 当前github上也有 ...
- Python爬虫新手进阶版:怎样读取非结构化网页、图像、视频、语音数据
导读:常见的数据来源和获取方式,你或许已经了解很多.本文将拓展数据来源方式和格式的获取,主要集中在非结构化的网页.图像.视频和语音. 01 从网页中爬取运营数据 要从网页中爬虫数据,可使用Python ...
- 人脑启发AI设计:让神经网络统一翻译语音和文本
来源:图灵人工智能 作者:Glaciohound 编辑:陈彩娴 能够统一地理解语音和文本,是人类能够形成通用语言能力的重要原因.那么,人工智能是否也能如此?最近,来自字节跳动和UIUC的研究人员借鉴这 ...
- 900万注释图像数据集升级了!谷歌开放Open Images V6,首增语音、文本、鼠标轨迹同步注释...
点击我爱计算机视觉标星,更快获取CVML新技术 本文转自量子位. 鱼羊 发自 云凹非寺 量子位 报道 | 公众号 QbitAI 谷歌的900万注释图像数据集Open Images,再次进化. 这一次的 ...
- RapidASR项目(语音转文本):更快、更容易部署、开箱即用
引言 本人就是该项目的贡献者之一!!! 目前在语音转文本的开源项目中,wenet算是其中翘楚,虽说在wenet repo下的README中写的是: WeNet 是一款面向工业落地应用的语音识别工具包, ...
- 基于ASRT的开源实时语音转文本
基于ASRT的开源实时语音转文本 文章目录 基于ASRT的开源实时语音转文本 ASRT语音识别系统相关资料 实时转写客户端 识别效果 ASRT语音识别系统相关资料 ASRT是AI柠檬博主(西安电子科技 ...
- Premiere Pro 2022带来离线语音转文本教程
Premiere Pro 2022大版本更新,在去年的的10月份更新也带来了不少实用功能.今日小编就为大家带来 Premiere Pro 2022 离线语音转文本教程.感兴趣的小伙伴们欢迎收藏! Ad ...
- Premiere Pro 2022离线语音转文本教程
Premiere Pro 2022大版本更新,在去年的的10月份更新也带来了不少实用功能.今日小编就为大家带来 Premiere Pro 2022 离线语音转文本教程.感兴趣的小伙伴们欢迎收藏!pre ...
最新文章
- linux在多核处理器上的负载均衡原理
- 别在被骗了!!!!!!
- 四则运算系统:分析和设计
- 安徽考区计算机水平考试试卷,安徽考区计算机水平考试试卷2011.6
- 前缀无歧义编码(PFC)
- openwrt 自动签到插件-食用指南
- pcie转sata3硬盘不启动_XPS 笔记本: 排除对 BIOS 默认设置的更改导致无法开机自检/无引导/硬盘或未检测到 SDD 问题...
- 位移密码加密、解密matlab实现
- 推荐 干掉垃圾流氓插件得批处理文件和注册表文件
- 大兴安岭和大草原的秋季游玩攻略
- 如何在windows下运用dd来下修复坏块?
- 前端面试题之浏览器原理篇
- mysql查询高于平均_查询成绩高于平均分的成绩记录。
- 【调剂】航天科工四院四部2023年度自培研究生开始调剂啦!!!
- 论流氓软件,以及其解决方法。
- css伪类炫酷迷幻边框
- 数字电路13-任意进制计数器设计
- 7.3结构体是纸老虎,旧知识新用法
- 抖音上用vbs写表白的小程序
- skimage.measure.label和skimage.measure.regionprops()