环境设置:
1、安装pip3 install pytesseract
2、安装tessract-OCR(将安装路径添加至环境路径,此处我安装在D:\Tesseract-OCR中)

导入pytesseract包时注意,修改D:\Python 32\Lib\site-packages\pytesseract中【pytesseract.py】文件中的代码修改至OCR的所在路径:
tesseract_cmd = 'D:\Tesseract-OCR\tesseract.exe’

import pytesseract
import cv2
import numpy as np
from scipy import stats
import os
import matplotlib.pyplot as plt
os.chdir('d:\\image')

读取视频的各个帧,将有字幕的图片片段提取出来,并以灰度图显示。

if __name__ == '__main__':path = "a.mp4"print(path)cap = cv2.VideoCapture(path)frame_count = int(cap.get(cv2.CAP_PROP_FRAME_COUNT))print(frame_count)i=0while i<frame_count:cap.set(cv2.CAP_PROP_POS_FRAMES, i)_, frame = cap.read(i)if i==48:cv2.imwrite('20210701.jpg',frame)shape = frame.shape#调整字幕显示的区间img=frame[550:600, 0:1070]plt.imshow(img)plt.axis("off")plt.show()img = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)  # 灰度图#cv2.imshow("Frame-2:Gray", img)            #显示灰度图_, img= cv2.threshold(img, 220, 255, cv2.THRESH_BINARY)  # 图像,阈值,映射的最大值,使用什么算法一般为cv2.thresh_binary#cv2.imshow("Frame-3:Binary", img)            #显示灰度图

用Tesseract-OCR对截取出的字幕图片进行分析,按每秒24帧计算,间隔2.5秒截取一次,提取字幕。

        #tessdata_dir_config = '--tessdata-dir "D:\\Tesseract-OCR\\tessdata"  --psm 7 -c preserve_interword_spaces=1'#设置中文字体word = pytesseract.image_to_string(img,lang='chi_sim',config=' --psm 7 -c preserve_interword_spaces=1')#config=tessdata_dir_config)print(word)#设置间隔时间i=i+24*2.5if cv2.waitKey(10) & 0xff == ord("q"):breakcap.release()cv2.destroyAllWindows()

结果显示:

#python 自动识别视频字幕相关推荐

  1. 基于图像识别和文字识别用 Python 提取视频字幕

    基于图像识别和文字识别用 Python 提取视频字幕 本文介绍使用 Python 基于图像识别提取视频中的字幕,并使用文字识别将字幕转为纯文本.本文以权力的游戏第一季第一集作为示例. 本文主要使用 O ...

  2. 如何用python实现视频字幕提取?

    要用Python实现视频字幕提取,需要用到一些第三方库.以下是一种使用Python和FFmpeg和pytesseract的方法: 1.安装FFmpeg和pytesseract 首先需要安装FFmpeg ...

  3. python提取视频字幕_GitHub - jiulinxiri/video-timeline-and-subtitle-extract: 视频时间轴及字幕提取...

    视频时间轴及字幕提取 能帮助你: 1.识别字幕的时间轴 通过帧差法判断是否相同帧, 进而由相同帧得出字幕时间轴 计算时间轴对应帧的 SSIM , 合并相同的时间轴 2.利用OCR识别字幕 将指定字幕区 ...

  4. python提取视频字幕_ffmpeg 提取 视频,音频,字幕 方法

    ffmpeg 提取 视频,音频,字幕 方法 (How to Extract Video, Audio, Subtitle from Original Video?) 1. 提取视频 (Extract ...

  5. python提取视频字幕_荐利用Python提取视频中的字幕(文字识别)

    学了好久机器学习的内容有些许枯燥,今天我们来做一个Python的小项目来玩耍吧! 项目背景 通过获取百度API实现视频文字识别. 需求阐述 将.MP4格式视频裁剪成一帧一帧的图片再将图片中的字幕摘取出 ...

  6. python提取视频字幕_利用Python提取视频中的字幕(文字识别)

    我的CSDN博客id:qq_39783601,昵称是糖潮丽子~辣丽 从今天开始我会陆续将数据分析师相关的知识点分享在这里,包括Python.机器学习.数据库等等. 今天来分享一个Python小项目! ...

  7. python自动翻译视频字幕_音视频自动字幕生成(翻译)—[autosub]

    国外有些视频无中文字幕找字幕也不方便 此工具可生成*.srt格式字幕和json autosub依赖ffmpeg 安装环境:VUlTR Ubuntu 18.04系统 地域:日本 充值10刀送10刀 安装 ...

  8. python自动翻译视频字幕_python利用google翻译字幕文件方法代码示例

    本篇文章小编给大家分享一下python利用google翻译字幕文件方法代码示例,文章代码介绍的很详细,小编觉得挺不错的,现在分享给大家供大家参考,有需要的小伙伴们可以来看看. 首先加载模块 pip u ...

  9. Python使用PaddleOCR本地进行视频字幕识别

    本文简述了利用OpenCV库以及PaddleOCR库对视频预定位置进行字幕提取并整合识别,在实际工程中,可以调用OCR的识别输出接口进行识别内容的批量保存. 后续改进方向参考: 1.PaddleNLP ...

最新文章

  1. 2-2 LU crout 分解
  2. ActiveMQ跟SpringBoot整合的双向队列
  3. centos7.0 php-fpm 安装ImageMagic php扩展imagick
  4. Ansible: hosts文件拆分为inventory和定义inventory全局变量
  5. 基于MHA+semi sync实现mysql数据库的高可用
  6. 计算机网络常见的无线传输有,第八讲 计算机网络基础.doc
  7. 视频分享:挨踢项目求生法则(2)——战略篇
  8. Flutter 2.5 发布啦,快来看看新特性
  9. 泛泰Bin文件格式解析及解压出IMG方法
  10. pe系统测试软件,使用PE系统显示器测试工具检测电脑屏幕的方法
  11. 08.29web自动化测试
  12. [blog] Speech Recognition Is Not Solved 语音识别领域尚待解决的子问题
  13. 虚拟机安装未开启虚拟化
  14. Python 自动化办公:Excel 自动绘制图表
  15. MySQL命令行导出导入数据库和数据表
  16. AS7341光谱传感器测量色温color_temperature_学习笔记
  17. 上班能做什么副业?上班太闲做个什么副业?
  18. Arjian不是Arjan:樱桃司这八年
  19. 数字冰雹 数字孪生城市智能运营中心(IOC)可视化决策系统
  20. 【ubuntu】运行.py文件

热门文章

  1. 若依框架不分离版本创建新模块(多模块版)
  2. 拆掉思维里的墙--书摘+个人理解
  3. 使用excel进行数据挖掘(4)---- 突出显示异常值
  4. appstore开发者中文名称修改
  5. 被吹上天的802.11ac Wave2到底好在哪?还有,Wave1哪去了?
  6. java计算机毕业设计小区失物招领网站源程序+mysql+系统+lw文档+远程调试
  7. fone出席CXO智库峰会,分享“老板需要什么样的全面预算?”
  8. Papi酱: 左手奶瓶右手尿布× 左手papitube右手娱乐圈√
  9. ​DB-Engines 11月数据库排名:PostgreSQL坐稳同期涨幅榜冠军宝座
  10. Linux-逻辑卷LVM