C#使用Tesseract OCR 解析验证码
下面介绍一个开源的OCR引擎Tesseract2。值得庆幸的是虽然是开源的但是它的识别率较高,并不比其他引擎差劲。网上介绍Tessnet2也是当时时间排名第三的识别引擎,只是后来慢慢不维护了,目前是Google在维护,大家都知道Google 在搞电子图书馆,每天都有不同类目的书被扫描成电子版。所以有G老大维护,识别率差不到哪里去。呵呵。。别鄙视我。。。
Tessnet2 是用vc ++ 开发的,其中是生成Tessnet2.dll ,我们可以通过.net 来调用内部具体类库实现识别。
Tessnet2的使用:
1、点击http://files.cnblogs.com/zhuxiangyu/tessnet2_32.rar链接下载Tessnet2.dll ,
Tessnet2是支持多国语的。语言包下载链接:http://code.google.com/p/tesseract-ocr/downloads/list
2、将Tessnet2.dll 添加到vs 引用中,和添加.net程序集一样。
3、用Tessnet2进行识别
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
|
WebRequest request = WebRequest.Create( "http://sz.2zf.cn/js/code2.asp" );
WebResponse response = request.GetResponse();
Stream st = response.GetResponseStream();
Bitmap bitmap = (Bitmap)Bitmap.FromStream(st);
UnCodebase ud = new UnCodebase(bitmap );
bitmap = ud.GrayByPixels();
ud.ClearNoise(128, 2);
pictureBox1.Image = bitmap ;
tessnet2.Tesseract ocr = new tessnet2.Tesseract(); //声明一个OCR类
ocr.SetVariable( "tessedit_char_whitelist" , "0123456789" ); //设置识别变量,当前只能识别数字。
ocr.Init(Application.StartupPath + @"\\tmpe" , "eng" , true ); //应用当前语言包。注,Tessnet2是支持多国语的。语言包下载链接:http://code.google.com/p/tesseract-ocr/downloads/list
List<tessnet2.Word> result = ocr.DoOCR(bitmap , Rectangle.Empty); //执行识别操作
string code = result[0].Text;
textBox1.Text = code;
|
识别效果:
代码下载:CSharp简单数字验证码解析.rar
https://www.cnblogs.com/ppcompany/articles/2708960.html
C#使用Tesseract OCR 解析验证码相关推荐
- php验证码百度ocr识别,利用百度OCR实现验证码自动识别
在爬取网站的时候都遇到过验证码,那么我们有什么方法让程序自动的识别验证码呢?其实网上已有很多打码平台,但是这些都是需要money.但对于仅仅爬取点数据而接入打码平台实属浪费.所以百度免费ocr正好可以 ...
- 【OCR识别验证码】--基于tesseract
目录 1.环境准备(windows) 2.实现目的: 3.代码实现 5.二值化处理 6.评价 1.环境准备(windows) 打开cmd(命令符窗口)输入以下命令: pip install pyte ...
- Tesseract——OCR图像识别 入门篇
近期leader给了我一个任务,让我研究图像识别,从我们项目的screenshot中识别文字信息,so我開始了学习.与大家分享下. 我看到眼下OCR技术有非常多,最基本的是Asprise OCR,Te ...
- Tesseract OCR简介(三)--安装及参数使用
参考:AI-Tesseract-OCR简介_花熊的博客-CSDN博客_tesseract坐标 一.windows 1.1 Tesseract安装 适用于Tesseract 3.05和Tesseract ...
- Tesseract OCR简介(一)
简介 Tesseract(/'tesərækt/) 这个词的意思是"超立方体",指的是几何学里的四维标准方体,又称"正八胞体".右图是一个正八胞体绕着两个四维空 ...
- 关于Tesseract OCR 中文训练识别小试(java调用Tess4j)
2017.9.20日小结 最近接到是关于消防系统协议解析仪器的项目,目的是从协议解析仪器获取有效数据,并解析数据(目的是不希望消防主机的数据信息再传给主机厂商而是最后能给自己收集调用).由于各个消防器 ...
- Tesseract OCR与文本智能识别
博主简介 博主是一名大二学生,主攻人工智能研究.感谢让我们在CSDN相遇,博主致力于在这里分享关于人工智能,c++,Python,爬虫等方面知识的分享. 如果有需要的小伙伴可以关注博主,博主会继续更新 ...
- 使用Tesseract OCR引擎和层次聚集聚类(HAC)对多列数据进行OCR
这篇博客将介绍如何使用Tesseract OCR引擎和层次聚集聚类(HAC)对多列数据进行OCR.包括学习一些OCR多列数据的提示和技巧,最重要的是,将文本的行/列关联在一起. 层次聚集聚类(HAC ...
- jTessBoxEditor for Tesseract OCR
jTessBoxEditor下载地址 http://vietocr.sourceforge.net/training.html 以下翻译自安装(解压)后的Readme文件 jTessBoxEditor ...
最新文章
- Python 中 (,|)和(and,or)之间的区别 逻辑判断
- pandas使用dropna函数删除dataframe中全是缺失值的数据列(drop columns with all missing values in dataframe)
- SAP QM 由于存在未清TO单导致QA11失败
- python多线程同步与互斥_Python之多线程:线程互斥与线程同步
- 【学习】程序员技术练级攻略
- python自动化常用模块_Python自动化 【第五篇】:Python基础-常用模块
- Timus 1018 树形DP
- Oracle CPU使用率过高问题处理
- 爬取前尘无忧python职位信息并保存到mongo数据库
- mysql orderby多个_MySQL OrderBy
- 哪些要素会让咱们呈现抑郁症的病症
- ChinaJoy 第二天,是谁独得万千宠爱?
- Sublime Text3的插件管理Package Control安装
- 怎样将自己学到的东西发布到博客
- 基于微信公众号的图书借阅平台设计与实现
- python中平方和_python的平方和怎么理解?
- Python 学习:函数
- Ubuntu界面显示不全的解决方法
- IP地址划分, 常见的CIDR划分,子网掩码对应表及在线CIDR工具
- 分治法--处理数列问题
热门文章
- OpenCV使用VideoWriter和VideoCapture的实例(附完整代码)
- QML范围和命名分辨率
- C++旋转二维MxN矩阵的算法(附完整源码)
- C语言实现List实现(附完整源码)
- c++状态模式state
- css 渐变色_如何设置渐变色的单元格值?
- 计算机组成原理 外部设备分为,2017考研计算机组成原理第七章考点:外部设备...
- java运行环境简称_Java程序的运行环境简称之为
- php redis zset 延迟队列_PHP + Redis 实现简单消息队列
- Scala方法定义,方法和函数的区别,将方法转换成函数