1,windows下有软件,百度一搜索一堆,但效果一般,推荐“录音啦”

2,开源软件autosub,archtime(视频添加字幕),其中autosub以来google的语音识别接口,国内翻“强"后稳定性不佳可能导致翻译失败(400M的视频,从来没成功过)

3,ibm工具SpeechRecognition

ffmpeg视频提取音频为wav
ffmpeg -i 01-20170326.mp4 -f wav  -ar 16000 01.wav

import speech_recognition as sr
path='/media/john/本地磁盘/TDDOWNLOAD/vnpy_video/01.wav'
r = sr.Recognizer()
with sr.WavFile(path) as source:
    audio = r.record(source)
IBM_USERNAME='xxxxx'
IBM_PASSWORD='xxxx'
text = r.recognize_ibm(audio, username = IBM_USERNAME, password = IBM_PASSWORD, language = 'zh-CN')
(如果太长的化可能会报错)

音频的倍率加速:ffmpeg -i 01.wav -filter:a "atempo=2.0" -vn 01_s.wav
音频的清除静音:ffmpeg -i 01_s.wav -af silenceremove=1:0:-50dB:-1:0:-50dB 01_sb.wav

多段视频合并

ffmpeg -i 03_sb.wav -i 04_sb.wav -filter_complex '[0:0] [1:0] concat=n=2:v=0:a=1 [a]' -map [a] cat_03_04.wav
ffmpeg -i 03_sb.wav -i 04_sb.wav -i 06_sb.wav -filter_complex '[0:0] [1:0] [2:0] concat=n=3:v=0:a=1 [a]' -map [a] cat_03_04_06.wav
ffmpeg -i 01_sb.wav -i 02_sb.wav -i 05_sb.wav -i 06_sb.wav -filter_complex '[0:0] [1:0] [2:0] [3:0] concat=n=4:v=0:a=1 [a]' -map [a] cat_01_02_05_06.wav

视频精确切分:ffmpeg -i cat_03_04_06.wav -ss 0 -t 7200 -codec copy cat_03_04_06_cat.wav

参考:https://blog.csdn.net/huplion/article/details/80839944
https://blog.csdn.net/qq_42156420/article/details/81122018
https://github.com/watson-developer-cloud/python-sdk
https://pypi.org/project/SpeechRecognition/
https://github.com/watson-developer-cloud/python-sdk
https://github.com/watson-developer-cloud/python-sdk/blob/master/examples/speech_to_text_v1.py
https://blog.csdn.net/tang20120235/article/details/49762421#

4,讯飞,百度等国内大公司的语音识别接口
开发参考:https://blog.csdn.net/yuanlulu/article/details/81947880
讯飞听见:https://www.iflyrec.com/html/addMachineOrder.html(长语音效果最佳,但是要收费)

视频or音频转文字的处理方案相关推荐

  1. psychopy 音频时长代码_PsychoPy入门_03_视频和音频的呈现

    不靠谱PsychoPy入门教程目录: 诶,这次说一下视频和音频的呈现.(这部分可用性较差,随意参看一下吧.) 把上一篇中的代码拿过来,删去图片部分,把文字呈现时间改回两秒.我们的开始代码是这样的: # ...

  2. php文件怎么改为mp3,[视频转音频软件]怎么把mp4转换成mp3音乐格式

    把mp4转换成mp3格式,很明显,mp4是视频格式,mp3是音频格式,视频转音频!还可以说成是提取视频中的音频或声音,其实这种需求在用户当中还是有一些的,比如需要提取某部电脑里面某段声音,去掉视频的画 ...

  3. 有哪些音频转文字的软件可以批量操作?

    在生活中,不管是线上听课还是远程的视频会议,有时我们对着电脑久了,难免会走神.虽然有的时候我们可能会使用手机录音来记录,但是后期我们根据回听录音文件来做笔记时,需要全神贯注的倾听,否则可能会错漏一些录 ...

  4. 不知道视频怎么转音频?手把手教你视频转音频

    大家有没有遇到这种情况,在网上浏览视频的时候,听到喜欢的配乐或者翻唱的歌曲.一些插曲旁白,想要将视频中的音乐提取出来保存收听或者用来做自己拍摄视频的背景音乐,那么视频怎么转音频呢?下面我就给大家分享3 ...

  5. 免费视频转文字-音频转文字软件:网易见外工作台, Speechnotes, autosub, Speech to Text, 百度语音识别

    文章目录 网易见外工作台(推荐) Chrome插件 Speechnotes autosub 百度语音识别API IBM的Speech to Text(不推荐) 此文首发于我的Jekyll博客:zhan ...

  6. 如何把视频或者音频转成文字

    今天就出一期干货 其实没有那么多的步骤啥的,就一个网站就可以解决所有问题,无论你是视频转文字还是音频转文字都可以的,并且不收费. https://sight.youdao.com/ 就是这个网易见外网 ...

  7. 智能消息服务-数字短信使用FAQ简介: 数字短信是基于普通短信,通过一套编码技术实现的短信服务。它能把视频、音频、网页、GIF图、文字等多种表现形式通过多媒体短信形式触达用户。本文将带你了解阿里云通信

    简介: 数字短信是基于普通短信,通过一套编码技术实现的短信服务.它能把视频.音频.网页.GIF图.文字等多种表现形式通过多媒体短信形式触达用户.本文将带你了解阿里云通信数字短信产品的开通与使用. 一. ...

  8. html照片怎么用作背景音乐,怎么把图片做成视频加字幕加音频 怎么把图片做成视频有背景音乐和文字说明...

    在现如今来说,把图片制作成视频已经不是什么新鲜事了,但却是个经久不衰的永恒,因为制作好了的视频有很好的纪念价值,这一意义就足矣.这个把图片成视频也还是需要花些心思.花些精力才能做得效果好的哦.下面一起 ...

  9. 使用FFmpeg进行视频抽取音频,之后进行语音识别转为文字

    1.首先需要下载FFmpeg: 2.Gradle依赖 def void forceVersion(details, group, version) {if (details.requested.gro ...

最新文章

  1. oracle备份及恢复
  2. Cannot find reference ‘PDFDocument‘ in ‘pdfparser.py‘
  3. HALCON Progress
  4. java random产生随机数_java的三种随机数生成方式,必掌握
  5. php is_dir 判断是否存在这目录
  6. 如何从Java EE无状态应用程序连接到MongoDB
  7. sed: -e expression #1, char 23: unknown option to `s'
  8. jupyter notebook如何打开其他文件夹下的iqynb文件
  9. python 干什么工作具有明显优势-为什么这么多人学Python?Python在就业上有什么优势?...
  10. socketmq 设置队列大小_TCP 半连接队列和全连接队列满了会发生什么?又该如何应对?...
  11. 了解OutOfMemoryError异常 - 深入Java虚拟机读后总结
  12. mac系统我的世界服务器,我的世界Mac版怎么联机?
  13. MFC访问共享文件夹
  14. 为Windows Live Writer写一个简单的插件
  15. Mac系统重置MySQL的 root密码
  16. android小米推送,Android手机端小米推送Demo解析和实现方法
  17. python 简洁优雅的装饰数据类——dataclass(通过生成只有部分属性值的子类解决初始化时没有默认值必须传所有字段值的问题)
  18. 正则表达式高级技巧背后的关键概念[SM]
  19. 寒假训练十(map,pair,string)2020.02.17(4题)
  20. 操作系统【动态分区分配算法——首次适应算法、最佳适应算法、最坏适应算法、临近适应算法】

热门文章

  1. Iass、Pass、Sass三种云服务有什么区别
  2. 详解三大专利类型之首:发明专利
  3. 最短路(弗洛伊德——最短路)
  4. vs2022安装详细
  5. boos直聘显示服务器繁忙,BOSS 直聘回应服务“崩了”:系统升级已完成,可正常使用...
  6. 单链表的算法之尾部插入节点
  7. 9104年了,你还中毒?—— Synaptics.exe 中毒小记
  8. 繁体批量转换工具:支持繁体字和简体本地化互转
  9. ajax tool works,,AJAX TOOLS.
  10. os.listdir('.')