#python 自动识别视频字幕

环境设置：
1、安装pip3 install pytesseract
2、安装tessract-OCR（将安装路径添加至环境路径，此处我安装在D:\Tesseract-OCR中）

导入pytesseract包时注意，修改D:\Python 32\Lib\site-packages\pytesseract中【pytesseract.py】文件中的代码修改至OCR的所在路径：
tesseract_cmd = 'D:\Tesseract-OCR\tesseract.exe’

import pytesseract
import cv2
import numpy as np
from scipy import stats
import os
import matplotlib.pyplot as plt
os.chdir('d:\\image')

读取视频的各个帧，将有字幕的图片片段提取出来，并以灰度图显示。

if __name__ == '__main__':path = "a.mp4"print(path)cap = cv2.VideoCapture(path)frame_count = int(cap.get(cv2.CAP_PROP_FRAME_COUNT))print(frame_count)i=0while i<frame_count:cap.set(cv2.CAP_PROP_POS_FRAMES, i)_, frame = cap.read(i)if i==48:cv2.imwrite('20210701.jpg',frame)shape = frame.shape#调整字幕显示的区间img=frame[550:600, 0:1070]plt.imshow(img)plt.axis("off")plt.show()img = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)  # 灰度图#cv2.imshow("Frame-2:Gray", img)            #显示灰度图_, img= cv2.threshold(img, 220, 255, cv2.THRESH_BINARY)  # 图像，阈值，映射的最大值，使用什么算法一般为cv2.thresh_binary#cv2.imshow("Frame-3:Binary", img)            #显示灰度图

用Tesseract-OCR对截取出的字幕图片进行分析，按每秒24帧计算，间隔2.5秒截取一次，提取字幕。

        #tessdata_dir_config = '--tessdata-dir "D:\\Tesseract-OCR\\tessdata"  --psm 7 -c preserve_interword_spaces=1'#设置中文字体word = pytesseract.image_to_string(img,lang='chi_sim',config=' --psm 7 -c preserve_interword_spaces=1')#config=tessdata_dir_config)print(word)#设置间隔时间i=i+24*2.5if cv2.waitKey(10) & 0xff == ord("q"):breakcap.release()cv2.destroyAllWindows()

结果显示：

#python 自动识别视频字幕相关推荐

基于图像识别和文字识别用 Python 提取视频字幕
基于图像识别和文字识别用 Python 提取视频字幕本文介绍使用 Python 基于图像识别提取视频中的字幕,并使用文字识别将字幕转为纯文本.本文以权力的游戏第一季第一集作为示例. 本文主要使用 O ...
如何用python实现视频字幕提取？
要用Python实现视频字幕提取,需要用到一些第三方库.以下是一种使用Python和FFmpeg和pytesseract的方法: 1.安装FFmpeg和pytesseract 首先需要安装FFmpeg ...
python提取视频字幕_GitHub - jiulinxiri/video-timeline-and-subtitle-extract: 视频时间轴及字幕提取...
视频时间轴及字幕提取能帮助你: 1.识别字幕的时间轴通过帧差法判断是否相同帧, 进而由相同帧得出字幕时间轴计算时间轴对应帧的 SSIM , 合并相同的时间轴 2.利用OCR识别字幕将指定字幕区 ...
python提取视频字幕_ffmpeg 提取视频，音频，字幕方法
ffmpeg 提取视频,音频,字幕方法 (How to Extract Video, Audio, Subtitle from Original Video?) 1. 提取视频 (Extract ...
python提取视频字幕_荐利用Python提取视频中的字幕（文字识别）
学了好久机器学习的内容有些许枯燥,今天我们来做一个Python的小项目来玩耍吧! 项目背景通过获取百度API实现视频文字识别. 需求阐述将.MP4格式视频裁剪成一帧一帧的图片再将图片中的字幕摘取出 ...
python提取视频字幕_利用Python提取视频中的字幕（文字识别）
我的CSDN博客id:qq_39783601,昵称是糖潮丽子~辣丽从今天开始我会陆续将数据分析师相关的知识点分享在这里,包括Python.机器学习.数据库等等. 今天来分享一个Python小项目! ...
python自动翻译视频字幕_音视频自动字幕生成(翻译)—[autosub]
国外有些视频无中文字幕找字幕也不方便此工具可生成*.srt格式字幕和json autosub依赖ffmpeg 安装环境:VUlTR Ubuntu 18.04系统地域:日本充值10刀送10刀安装 ...
python自动翻译视频字幕_python利用google翻译字幕文件方法代码示例
本篇文章小编给大家分享一下python利用google翻译字幕文件方法代码示例,文章代码介绍的很详细,小编觉得挺不错的,现在分享给大家供大家参考,有需要的小伙伴们可以来看看. 首先加载模块 pip u ...
Python使用PaddleOCR本地进行视频字幕识别
本文简述了利用OpenCV库以及PaddleOCR库对视频预定位置进行字幕提取并整合识别,在实际工程中,可以调用OCR的识别输出接口进行识别内容的批量保存. 后续改进方向参考: 1.PaddleNLP ...

#python 自动识别视频字幕

#python 自动识别视频字幕相关推荐

最新文章

热门文章