目录

一、安装tesseract-ocr

1、下载安装

2、设置环境变量:

​ ​ 3、测试安装是否成功

二、视频字幕识提取

1、基本步骤:

2、完整代码:

3、部分运行结果:


一、安装tesseract-ocr

1、下载安装

下载地址:Index of /tesseract

下载最新稳定版本:tesseract-ocr-w64-setup-v5.0.0.20190623.exe

2、设置环境变量:

Win+R打开命令行,输入sysdm.cpl打开设置Path的窗口,添加tesseract-ocr的路径

  3、测试安装是否成功

把语言文件拷贝到tessdata目录下

tesseract –v 测试安装

tesseract –list-langs测试语言包

二、视频字幕识提取

1、基本步骤:

(1)逐帧截取字幕部分图像范围

(2)cv2.cvtColor图像灰度化

(3)cv2.threshold二值化

(4)安装pytesseract:pip3 install pytesseract

pytesseract将图像上的Tesseract OCR运行结果返回到字符串

2、完整代码:

import pytesseract
import cv2
import numpy as np
from scipy import stats
import os
import matplotlib.pyplot as pltif __name__ == '__main__':path = "20210701.mp4"print(path)cap = cv2.VideoCapture(path)frame_count = int(cap.get(cv2.CAP_PROP_FRAME_COUNT))print(frame_count)i=0#print("1")while i<frame_count:cap.set(cv2.CAP_PROP_POS_FRAMES, i)#print("2")_, frame = cap.read(i)#print("3")if i==48:cv2.imwrite('20210701.jpg',frame)#print("4")shape = frame.shape#print("5")print(shape)cv2.imshow("Frame-1", frame[580:630, 10:1270])#print("6")img=frame[630:680, 50:1270]plt.imshow(img)plt.axis("off")plt.show()#cv2.imshow(img)img = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)  # 灰度图#cv2.imshow("Frame-2:Gray", img)            #显示灰度图_, img= cv2.threshold(img, 220, 255, cv2.THRESH_BINARY)  # 图像,阈值,映射的最大值,使用什么算法一般为cv2.thresh_binary#cv2.imshow("Frame-3:Binary", img)            #显示灰度图tessdata_dir_config = '--tessdata-dir "C:\\Users\\Administrator\\AppData\\Local\\Programs\\Python\\Python37\\Lib\\site-packages\\Tesseract-OCR\\tessdata"  --psm 7 -c preserve_interword_spaces=1'word = pytesseract.image_to_string(img,lang='chi_sim',#config=' --psm 7 -c preserve_interword_spaces=1')config=tessdata_dir_config)print(word)i=i+24*2if cv2.waitKey(10) & 0xff == ord("q"):breakcap.release()cv2.destroyAllWindows()

3、部分运行结果:

Python视频处理(3)——提取视频字幕相关推荐

  1. Python:使用PyAV提取视频关键帧

    Python:使用PyAV提取视频关键帧 1.软件环境⚙️ 2.问题描述

  2. Moviepy自动化视频处理:提取视频里的音乐(eg:MV音乐提取,抖音热门音乐提取)

    Moviepy自动化视频处理:提取视频里的音乐(eg:MV音乐提取,抖音热门音乐提取) 本文将讲述的工作: 提取单个短视频中的音乐 整个文件夹下所有视频的音乐,分别输出mp3文件 假想的用途场景: 你 ...

  3. python3抓取图片视频_Python opencv提取视频中的图片

    #-*- coding: utf-8 -*- importosimport cv2 ##加载OpenCV模块 def video2frames(pathIn='', pathOut='', only_ ...

  4. php 提取视频中的声音,怎么提取视频的声音 提取视频中的声音

    提取视频中的声音有很多的方法,软件也是很多,是不是有点选择困难户啦,先淡定!很多小伙伴提取视频中的声音是喜欢视频中的某段背景音乐,其实我们也可以是为了提取视频中的某段对话的声音或者是其他,总之只要你喜 ...

  5. 计算机按音乐视频,电脑怎么提取视频中的音乐

    当我们在看视频的时候,会遇到喜欢却又不熟悉的音乐:在播放音乐时,会有一些带版权的音乐不能播放,通过观看MV去听对应的音乐.在这些类似的情况下,大家可以通过提取视频中的音乐,将音乐以文件形式保存下来.有 ...

  6. 剪辑视频,如何提取视频封面

    今天给大家分享一个好用的剪辑软件,教你同时提取多个视频封面图,有这方面需求的小伙伴可以来看看,操作简单一看就会,下面小编就开始演示具体的操作步骤. 在处理的过程中需要借助软件"媒体梦工厂&q ...

  7. python截取视频图像_python提取视频第一帧图片

    一.实现代码 # -*- coding: utf-8 -*- import cv2 from PIL import Image from io import BytesIO def tryTime(m ...

  8. python截取视频图片_python提取视频第一帧图片

    一.实现代码 # -*- coding: utf-8 -*- import cv2 from PIL import Image from io import BytesIO def tryTime(m ...

  9. python 提取视频中的音频 | Python工具类

    目录 前言 环境依赖 工具代码 总结 前言 利用Python的ffmpy库提取视频中的音频.本文提供工具类代码. 环境依赖 需要安装ffmpy,安装指令: pip install ffmpy -i h ...

  10. 【Python】ffmpeg模块处理视频、音频信息

    多媒体视频处理工具FFmpeg有非常强大的功能包括视频采集功能.视频格式转换.视频抓图.给视频加水印等. 这里主要介绍一下FFmpeg的一些常用参数,并且主要功能:截取视频.视频格式转换.视频分辨率转 ...

最新文章

  1. Ubuntu16.04安装NVIDIA驱动+CUDA9.0+cuDNN7.0
  2. 不藏私分享五個線上自學平台
  3. 1022 Digital Library (30 分) 【难度: 中 / 知识点: 哈希表】
  4. BZOJ 1834 Luogu P2604 [ZJOI2010]网络扩容 (最小费用最大流)
  5. 重磅!微软发布 vscode.dev,把 VSCode 带入浏览器!
  6. beanshell断言_jmeter学习指南之响应断言和beanshell断言
  7. 使用Async对Angular异步代码进行单元测试
  8. python字符串,列表常用操作
  9. 2017 3月15日 上午
  10. GDAL不支持创建PCIDSK的面状矢量格式
  11. c# mysql 汉字乱码_c#+mysql 中文乱码
  12. Spring 测试代码的写法以及一个c3p0的错误
  13. USB协议详解第17讲(USB事务总结)
  14. idea activation code记录
  15. 苏秋贵:你为什么放弃了多年坚持的制造业?
  16. finereport帮助文档中期学习总结
  17. 我的世界java出生蘑菇岛,我的世界:有出生蘑菇岛和要塞的超大村庄?这超富有种子满足你!...
  18. 凸优化(一)绪论与凸集
  19. Maya获取材质ShadingEngine信息
  20. 统计学习方法 - 绪论部分

热门文章

  1. Nachos project1 领悟
  2. javascript基础知识之三座大山
  3. 教你怎么解决Linux依赖包第一篇:pkgs.org资源网下载
  4. 《长安十二时辰》,作为程序员,看完我震惊了!涉及通信、云计算、大数据等!...
  5. 重启linux没有网络配置文件,Linux 网络配置 修改DNS配置文件/etc/resolv.conf后,重启网络,DNS配置丢失...
  6. 从冯诺伊曼结构看AI
  7. App开发者如何选择移动广告平台1 - 开发者规模分析
  8. Monaco Editor教程(十八):使用api来完成某些键盘操作,格式化,查找,显示右侧菜单等。
  9. win10硬盘锁怎么解除_电脑磁盘加密了怎么解密_win10如何关闭硬盘加密
  10. Subclass in C++ - C++ 中的子类