【前置目的】
识别视频中是否包含目标元素;
抽象自动化,就是处理一段含有时间戳的视频;
再核心就是对视频进行图片裁减,识别出图片中的数字,做数学计算延时。

【学习地址】
环境:mac、python3、pytesseract库
关键语句:pytesseract.image_to_string 基本语言库,可支持汉子和数字的识别
后续就是OCR流程

  1. 机器学习

  2. 图像预处理:去噪、灰度化、图像增强等

  3. 文本检测: 滑动窗口算法遍历整张图片

  4. 字符分类: 划分单个字符,识别单字

【图片例子】
time1.png
time2.png

time3.pngtime4.png

eng.png

【代码实现】

import pytesseractdef seek_num():text1 = pytesseract.image_to_string(Image.open("time1.png"), lang='eng')print(text1)
识别结果:['ITE AY (8)\n\nbe\n\n20224712 A308\n\n']
['14:08:01\n']
['14:19:17\n\nFriday, 30 December 2022\n']
['14:56:10\n']
['nn BWNY\n\nWriting a Closing\n\nWrapping Up\n\nSummarize\n\nCheck for agreement\n\nReminders\n\nThank You / congratulations/ personal messages\n\nFollow Ups\n']

查看本地语言库支持的类型目录
cd /opt/homebrew/share/tessdata/

本地支持更高低点语言库,比如lang='chi_sim’等
https://github.com/tesseract-ocr/tessdata

【延伸问题】

  1. pytesseract对代测图片的内容要求很高,一般带有点文字内容会识别出数字!!!
  2. 视频每帧输出成图片

ffmpeg -i input.mp4 -r 1 -s 1280,720 -ss 00:00:00 %d.png

  1. 需要用ffmpeg对图片大小进行裁剪,才难识别出具体的数字

ffmpeg -i input.png -vf crop=600:170:330:570 outpit.png

crop=W:H:X:Y参数说明
W:输出视频的宽度
H:输出视频的高度
X:开始裁剪的水平位置,从左边开始(绝对左距为0)。默认为中心(iw-ow)/2
Y:开始裁剪的垂直位置,从视频的顶部开始(绝对顶部为0)。默认为中心(ih-oh)/2

(也可以在视频剪切成每张图片之前先对视频进行裁剪)

  1. 对输出的内容进行替换,可能存在标点符号的问题
    (勉强可用,支持了我的诉求~)

【图像算法】pytesseract简单实现图片数字识别相关推荐

  1. 用Python进行简单的图片数字识别(1)

    一.源代码 from PIL import Image im = Image.open("F:/result/4.jpg") # 先将图片转为固定宽高如55*55以符合一行txt文 ...

  2. Python 基础 之 jupyter notebook 中机器学习的简单入门书写数字识别 demo 操作学习

    Python 基础 之 jupyter notebook 中机器学习的简单入门书写数字识别 demo 操作学习 目录 Python 基础 之 jupyter notebook 中机器学习的简单入门书写 ...

  3. OPENCV图片数字识别

    这个非常麻烦,麻烦到我真的不想做 但是我也没有办法的呢 好了开始这个图片数字识别 例如把下面的信用卡上的数字识别出来 因为这次的代码分段比较多,所以把重复操作的过程打包成函数提前运行了 import ...

  4. python:pytesseract库实现图片文字识别

    import pytesseract from PIL import Imagetext = pytesseract.image_to_string(Image.open(r"E:\repo ...

  5. Tesseract-OCR 图片数字识别的样本训练

    最近想利用python写一段识别穿越火线交易所各种道具价格的代码.命令行执行: tesseract.exe grab.jpg result -l eng 使用默认的Tesseract语言库总会识别成字 ...

  6. opencl 加速 c语言程序_在AlveoU200加速卡上实现简单手写数字识别

    最近实验室租了块xilinx家的AlveoU200加速卡,过去几天被这块板吸引了注意力.刚开始了解,做点什么来试试水呢?一想,可以把曾经学 @蔡宇杰 大佬在pynq-z2上做的那个手写数字识别工程在这 ...

  7. (python)实现一个简单的图片文字识别脚本

    文章目录 截图 文字识别## 访问剪切板 总结 快毕业了,除了准备答辩之外,就是看看书,各种瞎晃~ 那么,这两天在看书的时候遇到这么个问题: 首先,部分电子版的书籍是以扫描图片的形式展现的,在阅读过程 ...

  8. python图片数字识别_python 识别图片上的数字

    https://blog.csdn.net/qq_31446377/article/details/81708006 ython 3.6 版本 Pytesseract 图像验证码识别 环境: (1) ...

  9. python实现简单的图片文字识别脚本

    我们都知道,部分电子版的书籍是以扫描图片的形式展现的,在阅读过程中无法选取文字.对于平时有记录习惯的人来说,无法复制黏贴真的很不爽! 为了解决这个问题,需要这样一个脚本,他有下面这些功能: 1.能够实 ...

最新文章

  1. 李国杰院士等:未来移动通信系统中的通信与计算融合
  2. netcore redis 存储集合_.net core redis的全套操作
  3. asp.net中实现文件批量上传
  4. WPF中MVVM模式的 Event 处理
  5. python编码和解码_Python中的编码与解码(转)
  6. 利用socket.io构建一个聊天室
  7. NP、P、NPC、NP-hard 概念辨析
  8. Layui组件和文档下载
  9. win10下安装SQLServer2005
  10. 迅雷U享版 v3.0.1.96 Lite V4 精简绿色版
  11. 电商直播系统源码该如何突破?
  12. xcode打包IPA(完整详细图文)
  13. mysql分级建表_Mysql如何使用命令实现分级查找帮助详解
  14. 基于区块链的数字藏品管控方案
  15. 基础知识(五)Blend2015 具有强大的组合功能,即合并功能。
  16. Netty网络编程学习笔记(四)——进阶篇
  17. 在html中字怎么修改位置,css怎么设置字体位置?
  18. 【Lee-Teambition】团队任务协作工具Teambition
  19. 针对宝宝肠胃保护,五大国际医生组织推荐使用爱乐乐益生菌
  20. HTTP Status 404(The requested resource is not available)(转)

热门文章

  1. 图书借阅管理系统的设计与实现/书籍借还管理系统
  2. 嵌入式应用层开发应该学习什么?
  3. Matplotlib二维箭头图
  4. 随机数qqqqqqqqqq_rand()
  5. 论ICC(intercoin capital)优越性!为什么选择ICC
  6. 微信公众号【程序员杂货铺】
  7. AJAX简单思维导图
  8. 海龟编辑器怎么运行html,海龟编辑器绘制五角星的操作流程
  9. input文本框中添加提示文字,输入后自动消失
  10. 通用的WAN协议配置