这两天自学关于自我感觉很牛的图文识别系统,给你一张图片可以扫描其中的文字(是不是很牛嘿嘿!!!),以下是我在学习过程中所遇到的一点问题。先前在学习之前肯定是安装各种文件,各种包……(头痛……),查过各种版本的安装流程。其中也有好多大牛写的(大牛请之行绕道……),而我是总结一下自己的安装加理解经验。

1.安装tesseract:这个文件很是智能,我们不用为环境变量中的path发愁,安装时安装包自动设置PATH变量

然而我安装的时候由于各种原因,我的语言包安装一直出现error,所以我直接跳过安装语言,并删除该软件文件夹的tessdata(语言包),在网上直接找到语言包解压,导入……

然后成功。为了检验我们的安装成功,我们可以自己用画图软件(画个数字,简单识别),创建一个imgname.png 图片,保存到一个文件夹,用dos 命令 输入:tesseractimgname.png imgname -l eng -psm 7 nobatch digits(imgname是自己文件的名字)

会在文件中找到一个文本文档,打开其中就有自己编写的数字。

安装pytesseract(win)

应用Fiddler获得验证码下载并用自己熟悉的语言(python)抓取网站的一系列验证码进行识别训练

2. 下载jTessBoxEditor:http://sourceforge.net/projects/vietocr/files/jTessBoxEditor/

合并图像的作用把上面我们爬取的验证码,进行合并,打包,

运行jTessBoxEditor工具

在点击菜单栏中Tools--->Merge TIFF

在弹出的对话框中选择样本图像(按Shift选择多张),合并成num.font.exp0.tif文件(注意文件名要严格一样num.font.exp0.tif)

生成Box File文件:CMD:tesseract.exe num.font.exp0.tif num.font.exp0 batch.nochop makebox

box文件的矫正:用jTessBoxEditor打开num.font.exp0.tif文件(必须将上一步生成的.box和.tif样本文件放在同一目录,并且为了方便使用我经他们和图片文件夹放到同级目录命名为左边的为img,右边的为生成的几个文件)

定义字体特征文件:在样本图片所在目录下创建一个名称为font_properties的文件,用记事本打开,输入以下下内容:font 0 0 0 0 0

注意: font_properties 和.box 一样是个文件不是其他

3.生成语言文件:调用 make_traineddata.bat

4. 复制语言文件

将生成的num.traineddata拷贝到Tesseract-OCR安装目录下的tessdata文件夹中

8. 测试

tesseract安装使用,人工智,图文识别验证码 系统操作(python)相关推荐

  1. (开源)简单的人脸识别考勤系统(python+opencv+dilb)

    简单的毕业设计,python+opencv+dlib,注意配置环境,打开工程文件直接运行.演示视频前往B站(开源)人脸识别签到系统_哔哩哔哩_bilibili 源文件及使用说明百度网盘下载链接: ht ...

  2. 人员抽烟行为识别检测系统 opencv+python

    人员抽烟行为识别检测系统基于opencv+python深度学习架构模型,对现场人员抽烟行为实施分析监测.YOLO网络是一个以目标检测为目的而设计的网络.YOLO系列算法的基本思想是将输入图像分割为S× ...

  3. python 训练识别验证码_用Python机器学习搞定验证码

    原标题:用Python机器学习搞定验证码 写爬虫有一个绕不过去的问题就是验证码,现在验证码分类大概有4种: 图像类 滑动类 点击类 语音类 今天先来看看图像类,这类验证码大多是数字.字母的组合,国内也 ...

  4. 安卓系统怎么安装软件_【图文】安卓系统手机如何下载安装APP

    我们以"支付宝APP"为例,介绍一下安卓系统手机(除苹果手机外大部分手机为安卓系统手机)下载安装APP的步骤. 安卓系统的手机使用方法是相似的,我使用的是华为P40,大家可以参考操 ...

  5. OCR之Tesseract安装

    Tesseract安装 一.Tesseract下载 二.添加环境变量 三.配置Tesseract中文识别语言包 四.下载相关库 五.示例程序 1.待识别图片 2.识别程序 3.识别结果 Tessera ...

  6. Qt实践| HTTP知识点-接入某图片验证码系统查询余额

    目录 基本概念 代码与实例 基本概念 这个是接入了某识别验证码系统,这个验证码系统有很多的接口,其中就有VC++接口,但个人觉得,这个接口不太好,因为本人想用C++ Qt框架实现,而这个Qt框架的最大 ...

  7. 反光衣穿戴识别检测系统 OpenCV

    反光衣穿戴识别检测系统通过Python基于OpenCV深度学习模型架构对现场人员着装进行实时分析检测.算机视觉技术是人工智能系统的一个分支方向,利用摄像机和计算机代替人眼,实现视觉图像信息处理,从而达 ...

  8. 河道水面漂浮物识别检测系统 YOLOv7

    河道水面漂浮物识别检测系统根据Python基于YOLOv7的深度学习模型,对现场画面进行识别检测.YOLOv7 在 5 FPS 到 160 FPS 范围内,速度和精度都超过了所有已知的目标检测器 并在 ...

  9. 水面漂浮物垃圾识别检测系统 YOlOv7

    水面漂浮物垃圾识别检测系统通过Python+YOLOv7网络模型,实现对水面漂浮物以及生活各种垃圾等全天候24小时不间断智能化检测.Python是一种由Guido van Rossum开发的通用编程语 ...

最新文章

  1. MySql库中所有表的属性_SQL查询某库所有的表所有的字段及字段的属性
  2. Spring之IoC总结帖
  3. 《大话数据结构》第2章 算法基础 2.9 算法的时间复杂度
  4. Scala数组元素的修改update
  5. CodeForces - 1418G Three Occurrences(线段树-标记永久化)
  6. SAP UI5 Connection manager
  7. 将 SharePoint 开发与其他形式的开发进行比较
  8. Unity3D-声音系统
  9. html安卓手机打开后只有半屏,宽度设置100%在移动端时变成一半
  10. 32岁了学python来的及吗_为什么每个人都应该在2020年学习Python?
  11. root用户Linux 环境变量的配置解决(-bash: jps: command not found)有关问题
  12. SaaS架构设计之共享设备
  13. 三大运营商发5G白皮书:传统短信迎大升级 推出5G消息
  14. wlan协议—802.11n—802.11ac 5G和2.4G
  15. 中国古代数学家张丘建在他的《算经》中提出了著名的“百钱买百鸡问题”:鸡翁一,值钱五,鸡母一,值钱三,鸡雏三,值钱一,百钱买百鸡,问翁、母、雏各几何?
  16. Python实现检测字符串是否全为汉字(含生僻字)
  17. 全网爆火的五款游戏蓝牙耳机,低延迟吃鸡听声辨位毫无压力
  18. 世事洞明皆学问-拉链拉头的拆分安装
  19. CT图像分割dicom文件与nii.gz文件预处理----窗宽(window width)和窗位(window level)的设置
  20. 面试小知识(2)为什么TCP需要三次握手和四次挥手

热门文章

  1. 手机电子词典_我的电子词典在课堂上宏亮地说了一声“拉屎”!!!
  2. 用Python破解翻译词典反爬虫机制!反爬虫也就这样嘛!
  3. python 图片地址_【Python爬虫】第四课(查询照片拍摄地址)
  4. Guacamole搭建,一个基于HTML5的远程桌面
  5. 多线程线程执行先后顺序
  6. 7-2 英文单词排序 (25 分)
  7. 萌新微信小程序成长-2(上传图片以及预览和大图预览)
  8. 这就是你向往的读研生活?不同专业研究生日常一览!
  9. 销售和程序员哪个好_适合服装店的服装销售管理软件哪个好?
  10. 基于无人机的无线电点对点验证解决方案——无需危险爬塔,高效快捷