一、视频转文本

肯定会有其他方便的转换行为或软件,这里只提供目前使用过的方法。

1、使用格式工厂,转换视频为MP3。

2、使用二、语音转文本

二、语音转文本

1、打开讯飞开放平台,注册账号

2、打开语音转写接口介绍页

3、点击免费使用→上传身份证正反面实名注册→领取新用户礼包(个人开发者和企业开发者免费使用),可领到语音转写5小时、极速语音转写10小时,有效期1年。

4、打开语义转写服务管理页,复制你的APPID和SecretKey,粘贴到到下列Java(或Python代码)中的对应变值。

注: demo只是一个简单的调用示例,不适合直接放在复杂多变的生产环境使用

语音转写demo python3语言

语音转写demo java语言

语音转写demo nodejs语言

语音转写demo php语言

5、运行Java项目中的WeblfasrDemo.java类,等待分片上传语音文件、转写等待、返回JSON字符串数据。

6、把控制台打印的JSON数组字符串,复制到下面代码的json变量中,执行main方法,完成处理返回的JSON字符串,保存到txt文件。

没有把下面这个代码直接集成到样例项目里。操作步骤可合并。

package com.iflytek.voicecloud.lfasr.demo;import com.alibaba.fastjson.JSONArray;
import com.alibaba.fastjson.JSONObject;import java.io.File;
import java.io.FileOutputStream;
import java.io.IOException;
import java.nio.charset.StandardCharsets;public class JSONToFile {public static void main(String[] args) {// 把控制台打印的JSON数组字符串复制到这里String json = "[{\"bg\":\"1342490\",\"ed\":\"1345720\",\"onebest\":\"和债务可持续原则的这样一个多元化的投融资体系。\",\"speaker\":\"0\"}]";// 解析onebest中的文本String text = getText(json);// 保存到文件saveKeyToFile(text, System.getProperty("user.dir") + File.separator + "text" + File.separator + "d1.txt");}public static String getText(String json) {StringBuilder builder = new StringBuilder();JSONArray array = (JSONArray) JSONObject.parse(json);for (Object object : array) {JSONObject obj = (JSONObject) object;builder.append(obj.get("onebest"));builder.append("\n");}return builder.toString();}public static void saveKeyToFile(String content, String filePath) {try (FileOutputStream fos = new FileOutputStream(filePath)) {fos.write(content.getBytes(StandardCharsets.UTF_8));} catch (IOException e) {throw new RuntimeException(e);}}
}

02 视频或语音转文本相关推荐

  1. 【Google语音转文字】Speech to Text 超级好用的语音转文本API

    前面有一篇博客说到了讯飞输入法,支持语音输入,也支持电脑内部音源输入,详细参考:[实时语音转文本]PC端实时语音转文本(麦克风外音&系统内部音源) 但是它只是作为一个工具来使用,如果我们想自己 ...

  2. 《AI上字幕》基于openAI研发的whisper模型,语音(视频)一键转文本/字幕/带时间轴/支持多语言/自带翻译《桌面版教程》

    简介: OpenAI的chatGPT非常火爆,其实OpenAI旗下的另一个模型实力也十分强大,它就是开源免费的Whisper语音转文本模型,目前为止它是较为顶尖的语音转文本模型 当前github上也有 ...

  3. Python爬虫新手进阶版:怎样读取非结构化网页、图像、视频、语音数据

    导读:常见的数据来源和获取方式,你或许已经了解很多.本文将拓展数据来源方式和格式的获取,主要集中在非结构化的网页.图像.视频和语音. 01 从网页中爬取运营数据 要从网页中爬虫数据,可使用Python ...

  4. 人脑启发AI设计:让神经网络统一翻译语音和文本

    来源:图灵人工智能 作者:Glaciohound 编辑:陈彩娴 能够统一地理解语音和文本,是人类能够形成通用语言能力的重要原因.那么,人工智能是否也能如此?最近,来自字节跳动和UIUC的研究人员借鉴这 ...

  5. 900万注释图像数据集升级了!谷歌开放Open Images V6,首增语音、文本、鼠标轨迹同步注释...

    点击我爱计算机视觉标星,更快获取CVML新技术 本文转自量子位. 鱼羊 发自 云凹非寺 量子位 报道 | 公众号 QbitAI 谷歌的900万注释图像数据集Open Images,再次进化. 这一次的 ...

  6. RapidASR项目(语音转文本):更快、更容易部署、开箱即用

    引言 本人就是该项目的贡献者之一!!! 目前在语音转文本的开源项目中,wenet算是其中翘楚,虽说在wenet repo下的README中写的是: WeNet 是一款面向工业落地应用的语音识别工具包, ...

  7. 基于ASRT的开源实时语音转文本

    基于ASRT的开源实时语音转文本 文章目录 基于ASRT的开源实时语音转文本 ASRT语音识别系统相关资料 实时转写客户端 识别效果 ASRT语音识别系统相关资料 ASRT是AI柠檬博主(西安电子科技 ...

  8. Premiere Pro 2022带来离线语音转文本教程

    Premiere Pro 2022大版本更新,在去年的的10月份更新也带来了不少实用功能.今日小编就为大家带来 Premiere Pro 2022 离线语音转文本教程.感兴趣的小伙伴们欢迎收藏! Ad ...

  9. Premiere Pro 2022离线语音转文本教程

    Premiere Pro 2022大版本更新,在去年的的10月份更新也带来了不少实用功能.今日小编就为大家带来 Premiere Pro 2022 离线语音转文本教程.感兴趣的小伙伴们欢迎收藏!pre ...

最新文章

  1. linux在多核处理器上的负载均衡原理
  2. 别在被骗了!!!!!!
  3. 四则运算系统:分析和设计
  4. 安徽考区计算机水平考试试卷,安徽考区计算机水平考试试卷2011.6
  5. 前缀无歧义编码(PFC)
  6. openwrt 自动签到插件-食用指南
  7. pcie转sata3硬盘不启动_XPS 笔记本: 排除对 BIOS 默认设置的更改导致无法开机自检/无引导/硬盘或未检测到 SDD 问题...
  8. 位移密码加密、解密matlab实现
  9. 推荐 干掉垃圾流氓插件得批处理文件和注册表文件
  10. 大兴安岭和大草原的秋季游玩攻略
  11. 如何在windows下运用dd来下修复坏块?
  12. 前端面试题之浏览器原理篇
  13. mysql查询高于平均_查询成绩高于平均分的成绩记录。
  14. 【调剂】航天科工四院四部2023年度自培研究生开始调剂啦!!!
  15. 论流氓软件,以及其解决方法。
  16. css伪类炫酷迷幻边框
  17. 数字电路13-任意进制计数器设计
  18. 7.3结构体是纸老虎,旧知识新用法
  19. 抖音上用vbs写表白的小程序
  20. skimage.measure.label和skimage.measure.regionprops()

热门文章

  1. Bootstrap 图片及缩略图
  2. Dynamic programming 1
  3. Windows 11 安装 Matlab 2022a 保姆级教程
  4. hosts : IP - 主机名/域名映射
  5. 《一代大商孟洛川》经典台词
  6. 用matlab求摆线,摆线-最速降曲线Matlab示例
  7. Android中实现图片编辑功能
  8. 使用阿里云对象存储oos遇到跨域访问的问题
  9. codeforces884D(大概是构造,优先队列)
  10. 解析android多语言与自定义字体