大家好,我是一行

不知道你有没有录过自我介绍的视频,尤其是那种加上PPT播放的长时间视频

可能因为说错一句话就得重来,又或者因为思考而暂停时间太久又得重来,以至于弄了两个小时才做好五分钟的视频

所以就像为了答辩一样,为了让演讲流利不卡壳一遍过,不停的熟读稿子,又或者提前花费大量时间把稿子写好,在录屏的时候对着读

但是光写稿子也要花费了大量的时间啊

所以我想到的方法就是先对着照PPT说一遍并录下来,再将用代码自动将音频自动提取出来转成文字,然后第二遍正式录制视频的时候看着生成的讲稿就不用因为不熟练而卡壳,同时也省去了一个个码字的时间消耗

所以为了更好的去录制视频,这里将上述过程全部用代码流程化分享给大家

  • 视频提取音频

  • 音频频率转化、音频切割

  • 音频转成文字

1视频提取音频

如果你练习时是录的视频,那需要将视频里的语音提取出来,方便后期操作

当然这个过程目前在各个视频剪辑软件里都可以一键分割,例如剪映、必剪、Pr等等

但是当任务量增加的时候,操作就显得非常浪费时间,而用Python的话3行代码就可以提取出来,就算任务量增加最多再加个循环即可

代码如下

from moviepy.editor import AudioFileClip
# 导入视频
my_audio_clip = AudioFileClip("一行玩Python/1012 视频转文字/11.mp4")
# 提取音频并保存
my_audio_clip.write_audiofile("一行玩Python/1012 视频转文字/11.wav")

2音频转文字

提取音频之后就要把音频转成文字了,目前市面上有很多方式都可以快速的将视频里的音频内容转成文字

  • 科大讯飞、知意等付费平台

  • 剪映、Pr等剪辑如案件生成字幕

  • 百度云、腾讯云等国内接口

  • GOogle、IBM、Bing等国外接口

  • 自己造轮子,语音识别训练

  • 自己一边听一边打字

虽然说有这么多方法可以去实现这个需求,但任务量增长后,想不花钱,又想不花时间造轮子,最好的办法就是用现成的接口

百度接口使用

申请百度接口

如果想用百度接口来批量处理,需要

百度语音API地址:https://cloud.baidu.com/doc/SPEECH/index.html

from aip import AipSpeech""" 你的 APPID AK SK """
APP_ID = 'xxx'
API_KEY = 'xxxxxxxxxxxxxxxxxxxxxxxx'
SECRET_KEY = 'xxxxxxxxxxxxxxxxxxxxxxxx'client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)# 读取文件
def get_file_content(file_path):with open(file_path, 'rb') as fp:return fp.read()# 识别本地文件
result = client.asr(get_file_content('音频.wav' % i), 'wav', 16000, {'dev_pid': 1537  # 默认1537(普通话 输入法模型),dev_pid参数见本节开头的表格
})print(result['result'])

如果你恰巧是用mac录的音频,那就得对音频进行降频处理

因为百度接口只能识别16 kHz的音频,而mac录的是48 kHz的音频,当然用ffmpeg重采样一下就可以

import ffmpeg
ffmpeg.input('输入音频.wav').output('输出音频.wav', ar=16000).run()

如果的你音频比较长,但是百度短语音识别接口支持1分钟以内的音频,这时候需要对音频进行分割处理

from pydub import AudioSegment
from pydub.utils import make_chunks#blues文件30s
audio = AudioSegment.from_file("voice.wav", "wav")size = 30000  #切割的毫秒数chunks = make_chunks(audio, size)  ##将文件切割为59s一块for i, chunk in enumerate(chunks):##枚举,i是索引,chunk是切割好的文件chunk_name = "voice{0}.wav".format(i)print(chunk_name)##保存文件chunk.export(chunk_name, format="wav")

然后重采样、剪切好的音频循环调用百度API接口就可以完成了~

exe

当然,也有前辈利用百度API直接写成了一个exe来使用

只需要在刚才百度智能云注册申请账号即可使用

3最后

而现在互联网的大趋势是视频内容,了解视频相关的应用对于做内容也非常有帮助

之前有前辈分享过如果做短视频创作秘籍,就是把互联网上最火的内容下载个1、200个,然后拿来翻拍,毕竟火过的内容很大概率还会再火

当然有些人会向我过去一样质疑,这tm不是抄袭嘛,但是很多内容本来就可以同主题多形式的,例如别人拍的炒蛋炒饭,那你同样可以翻拍炒蛋炒饭,这有什么不好的吗

而批量下载抖音之前介绍过,现在又可以把这些的视频内容提取出来,下一步就可以进行批量翻拍,离实现一个小目标岂不是越来越近了

技术永不眠,下期见~


一行把自己的各种Python玩法文章整理成了一本电子书,干货满满!

目录如下,还包括自己各种面试赚钱经验,现在免费送给大家~

链接: https://pan.baidu.com/s/11R1XRdxbDrFeHdosfP3aGA 密码: dl55

Python语音转文字、音频切割、语音识别相关推荐

  1. python语音转文字api_大数据分析Python PyAudio库语音API转文字教程

    在大数据分析Python语音转文字教程中,我将演示如何使用Python将语音转换为文本.这可以借助"语音识别" API和" PyAudio"库来完成. 语音是最 ...

  2. python语音转文字_Python文字转语音示例

    python语音转文字 Here you will get python text to speech example. 在这里,您将获得python文本语音转换示例. As we know, som ...

  3. python语音转文字软件_python编写语音转文字软件|语音转文字工具免费版下载(语音批量转换文字) v2.0 最新版_数码资源网...

    没有专业的工具怎么能够将语音转换为文字呢?小编为大家提供了语音转文字工具免费版,一款通过Python编写语音转文字软件.用户通过使用语音转文字工具免费版,可以将语音批量转换文字,而且操作也是非常的简单 ...

  4. 【Buzz】离线语音转文字、实时语音识别

    Buzz是基于 OpenAI Whisper的离线语音转文字(字幕),实时语音识别工具. 功能 实时语音转文字.实时翻译(需麦克风权限) 导入音频.视频文件(mp3.wav.m4a.ogg.mp4.w ...

  5. python语音转文字代码

    可以使用 Python 中的语音识别库--SpeechRecognition 来实现语音转文字. 这是一个简单的例子: import speech_recognitionas sr# 创建一个 Rec ...

  6. python 语音转文字软件_十行Python代码将微信语音转文字

    QQ和微信这两款都是非常受人喜欢的聊天交友软件!可能大家平时没有留意到,也或者是大家可能很少用微信,或者很少用QQ吧!所以可能没有留意这些小细节!就是QQ上面发的语音消息是可以直接文字识别的,但是微信 ...

  7. pcm转mp3_【新】PC语音转文字/音频视频都能转!

    前言 之前发的语音转文字软件失效了,这玩意儿,貌似需求量有点高,重新来个新的,带走. 语音转文字 云知音是一款支持语音转文字的软件,借助百度语音识别接口,就可以将MP3.wav.pcm.MP4格式的文 ...

  8. python语音转文字-【一点资讯】使用Python 进行语音识别---将音频转为文字

    今天给大家讲一个案例,在不联网的情况下,依然可以通过python来将语音文件转换成文字.这里用到的包为sphinx,sphinx是由美国卡内基梅隆大学开发的大词汇量.非特定人.连续英语语音识别系统.有 ...

  9. python 语音转文字_基于python将音频文件转化为文本输出

    实验目的:学习利用python进行音频转文本文件 实验环境:已正确安装python3.5 1.需要安装的第三方库 (1)安装speechrecognition speechrecognition集合了 ...

  10. python 语音转文字_长时间的会议录音如何快速转化成文字?

    最近在整理之前工作的文件,发现大概有50个小时的专家call & 会议录音啥的,于是就研究了一下如何批量把长语音转成格式优美的文字文档. 当然做事情之前先来知乎搜了搜有没有现成的解决方案可用, ...

最新文章

  1. SSH连接不上Linux的解决方法
  2. html-webpack-plugin插件 根据模板生成多页面
  3. 返乡置业?多数人将掉入陷阱
  4. CakePHP之Model
  5. CodeForces 906D (欧拉降幂)
  6. Git之深入解析如何交互式暂存
  7. Python二级笔记(7)
  8. 自疫情暴发以来,99%的中国IT决策者认为数据变得更重要
  9. 力扣-179 最大数
  10. 头条-day04_文章搜索前后端成形记 实名认证审核
  11. 计算机硬盘分区显示不全,windows7系统磁盘分区图标显示不正常的两种解决方法【图】...
  12. Jetson Tegra X系列刷机教程
  13. Android 邮箱自动补全-MultiAutoCompleteTextView实现
  14. 仿滴滴打车时间选择器开始结束时间
  15. 江苏大学京江学院计算机怎么样,江苏大学京江学院是几本 学生评价怎么样好不好(10条)...
  16. 关于阿里云视频点播出现的问题
  17. 工程师的18个梦想,你有几个?
  18. 服务器系统盘40g是什么,云服务器 40g系统盘
  19. Freeswitch 安装
  20. APP软件开发定制返利网分销商城APP

热门文章

  1. 西北乱跑娃 --- python繁体字简体字互转第三方库
  2. C语言字符常量与常量定义
  3. 同济线性代数教材(第五版)-第1章 行列式
  4. 渗透测试工具——BurpSuite
  5. 高精度地图技术与展望
  6. 一个很好的多代理服务器调度软件-ProxyExpert(绿色软件) - 『 软件使用交流 』 - 赢政天下 - YingZheng.com - Powered by Discuz!...
  7. reader java_Java Reader 类
  8. mapgis矢量化怎么打分数_MapGIS67操作手册(3-12)MapGIS67矢量化的基本流程
  9. 导入依赖aspectjweaver以及spring从容器中使用getBean(类名.class)方法获取对象的注意
  10. c语言 数据结构面试题及答案,数据结构c语言版试题大全(含答案).docx