OpenCV身份证离线识别技术的主要技术就是通过OpenCV找到身份证号码区域,然后通过OCR进行数字识别该区域的截图即可得到身份证号码。本地ORC使用tess-two来完成,Tesseract是C++实现的OCR引擎,在Android中使用不是很方便,需要封装JavaAPI才能在Android平台中进行调用,然而tess-two已经帮我们做好了这些事情,通过集成tess-two就可以很方便的完成文字识别。

总体思路

图像的预处理

1、无损压缩

首先要处理的问题就是图片的大小不一样,因为每台设备的的像素或者说每个图片的大小本身都不一样,处理过程也会有所差异,所以首先解决的问题就是大小统一,先通过无损压缩把图片处理为大小一致的图像。根据经验值(或者说这是处理证件类的通用手法),先把图像处理为640×400的大小。

2、灰度化

现在大部分的彩色图像都是采用RGB颜色模式,处理图像的时候,要分别对RGB三种分量进行处理,实际上RGB并不能反映图像的形态特征,只是从光学的原理上进行颜色的调配。图像灰度化处理可以作为图像处理的预处理步骤,为之后的图像分割、图像识别和图像分析等上层操作做准备。

其实可以仔细想想,如果是处理一张RGB图像的话,一个像素点需要同时处理3个值,灰度化之后只需要处理一个值。如果是对比的话,一个RGB像素点就有256×256×256种可能,但是如果是对比灰度图的像素点,则只有256种可能,65536倍的速度提升,所以很多时候做其他图像处理之前,先转化为灰度图。

图像灰度化处理有分量法、最大值法、平均值法、加权平均法,其中用得较多的是加权平均法。由于人眼对绿色的敏感最高,对蓝色敏感最低,因此,按下式对RGB三分量进行加权平均能得到较合理的灰度图像:

$$

\operatorname{Gray}(i, j)=0.299 * R(i, j)+0.578 * G(i, j)+0.114 * B(i, j)

$$

3、图像二值化

通过以上对彩色图片进行灰度化以后,把获取到的灰度图像进行二值化处理。对于二值化,其目的是将目标用户背景分类,为后续车道的识别做准备。灰度图像二值化最常用的方法是阈值法,他利用图像中目标与背景的差异,把图像分别设置为两个不同的级别,选取一个合适的阈值,以确定某像素是目标还是背景,从而获得二值化的图像。比如以100为阈值对图像进行二值化操作:

$$

f(i, j) = \left{\begin{array}{cc}

0, & (\text { gray }< = 100) \

255, & (\text { gray }>100)

\end{array}\right.

$$

4、膨胀与腐蚀

膨胀与腐蚀属于图像处理中最基本的形态学运算,形态学操作就是基于形状的一系列图像处理操作。OpenCV为进行图像的形态学变换提供了快捷且方便的函数。主要用于噪声消除、分割出独立的图像元素、在图像中连接相邻的元素、寻找图像中的明显的极大值区域或极小值区域、求出图像的梯度。

简单理解,膨胀就是求局部最大值的操作。腐蚀就是求局部最小值的操作。在处理身份证的时候,我们希望把身份证号码等数字区域连接在一起,即在图像中连接相邻的元素,所以需要使用膨胀处理,就跟蒸馒头的酵母粉一样,可以是我们想要的元素膨胀并且黏合在一起。

5、轮廓检测与图像分割

通过图像的膨胀操作,身份证号码区域已经被连接在一起了,目前需要做的事情就是检测出该区域的轮廓,使用拉普拉斯算子可以完成这个操作,OpenCV内部也提供了findContours函数做轮廓检测。

那么如何分割出身份证号码区域呢?其实有一个非常简单的思路,由于身份证号码是一串不换行的数字,宽高比通常是大于9:1的,而且是位于最后一行的,如果有其他的部分的宽高比大于9:1但是却不是位于最后,那么也不能认为是身份证号码,只有坐标是最底部,而且宽高比满足大于9:1的条件才可以。

VS2022 + OpenCV4.5.4

#include <iostream>
#include <opencv2/opencv.hpp>
#include <vector>#define DEFAULT_CARD_WIDTH 640
#define DEFAULT_CARD_HEIGHT 400#define FIX_IDCARD_SIZE Size(DEFAULT_CARD_WIDTH, DEFAULT_CARD_HEIGHT)#define FIX_TEMPLATE_SIZE Size(153, 28)using namespace std;
using namespace cv;int main() {std::cout << "Hello, World!" << std::endl;Mat src = imread("src.png");imshow("src", src);//处理身份证Mat src_img = src;//1、无损压缩 640*400 (通用卡片类的处理方式)resize(src_img, src_img, FIX_IDCARD_SIZE);imshow("dst", src_img);Mat dst_img;//2、灰度化Mat dst;cvtColor(src_img, dst, COLOR_BGR2GRAY);imshow("gray", dst);//3、二值化(降噪)threshold(dst, dst, 100, 255, THRESH_BINARY);imshow("threshold", dst);// 4.1 腐蚀、膨胀Mat erodeElement = getStructuringElement(MORPH_RECT, Size(20, 10));erode(dst, dst, erodeElement);imshow("erode", dst);//4、轮廓检测,把所有的连续的闭包用矩形包起来/** 一个矩形用两个点表示,contours就包含了很多矩形*/vector<vector<Point>> contours;vector<Rect> rects;findContours(dst, contours, RETR_TREE, CHAIN_APPROX_SIMPLE, Point(0, 0));for (size_t i = 0; i < contours.size(); i++){// 基于两点构建矩形Rect rect = boundingRect(contours.at(i));// 绘制矩形rectangle(dst, rect, Scalar(0, 0, 255));imshow("contours", dst);// 对符合条件的图片进行筛选,宽高比大于1:9的if(rect.width > rect.height*9){cout << "找到了" << endl;rects.push_back(rect);rectangle(dst, rect, Scalar(0, 0, 255));// 还需要再次矫正//dst_img = src_img(rect);}}// imshow("dst_Img", dst_img);// 如果只找到了一个矩形,说明这个就是,如果多个就找出纵坐标最低的矩形if(rects.size() == 1){Rect rect = rects.at(0);dst_img = src_img(rect);}else{int lowPoint = 0;Rect finalRect;for (size_t i = 0; i < rects.size(); ++i){Rect rect = rects.at(i);Point p = rect.tl();if(rect.tl().y > lowPoint){lowPoint = rect.tl().y;finalRect = rect;}}rectangle(dst, finalRect, Scalar(255, 255, 0));dst_img = src_img(finalRect);}imshow("dst_Img", dst_img);waitKey();return 0;
}

CMakeList.txt

cmake_minimum_required (VERSION 3.8)project(opencv_idcard)set(CMAKE_CXX_STANDARD 11)add_executable (opencv_idcard "opencv_idcard.cpp" )set(OpenCV_DIR "D:/develop/opencv-4.5.4/opencv-4.5.4-build")find_package(OpenCV REQUIRED)include_directories(${OpenCV_INCLUDE_DIRS})target_link_libraries(opencv_idcard ${OpenCV_LIBS})

来看看通过一系列的处理效果吧:

接下来要干的事情就主要有两件,首先是继承tess-two到Android,这样离线识别便搞定了,另外一件事情就是图像预处理的代码移植到Android上,这两件事情完成便搞定了身份证号码离线识别的功能了。

OpenCV身份证离线识别技术实战(一)相关推荐

  1. 分享一种身份证OCR识别技术

    身份证识别SDK 移动互联网在快速发展,APP进入了我们的生活,越来越多的公司都推出了自己的移动APP,这些APP多数都涉及到个人身份证信息的输入认证(即实名认证),如果手动去输入身份证号码和姓名,速 ...

  2. 手机扫描身份证ocr识别技术

    一.手机扫描身份证自动识别的技术应用背景 这些年,随着移动互联网的的发展,越来越多的企业都推出了自己的移动APP,这些APP多数都涉及到个人身份证信息的输入认证(即实名认证),如果手动去输入身份证号码 ...

  3. 基于人脸识别技术实战开发人证比对访客系统

    2019独角兽企业重金招聘Python工程师标准>>> 最近有个小区用到了虹软的人脸识别,效果还不错.又有一个项目要用人证访客对比,分享一下项目,希望可以帮到有需要的. 码字前先上项 ...

  4. c++ opencv 身份证OCR识别:前期数据训练库准备(tesseractOCR)

    前言:本文已经在个人博客更新排版和讲解[传送门] 整个教程已经在有道云写好了,在博客要重新把每个图片再上传一次有点累,先截了图直接看吧! 如果有需要有提供word版本可以下载 https://down ...

  5. 原创:谈谈计算机图像识别技术之身份证号码识别

    原创:谈谈计算机图像识别技术之身份证号码识别 作者:刘常军(2014-1-21)   前两天看到一篇文章,说支付宝钱包的iOS版和Android版已经升至8.0,只要通过摄像头对准银行卡进行扫描,支付 ...

  6. 谈谈计算机图像识别技术之身份证号码识别

    转载自 http://www.cnblogs.com/liu7537/p/3528968.html 作者:刘常军(2014-1-21)   前两天看到一篇文章,说支付宝钱包的iOS版和Android版 ...

  7. OCR证件识别技术的功能特点

    OCR证件识别技术的功能特点 1.识别身份证种类多:可识别二代身份证(包含汉族身份证和少数民族身份证).香港身份证.澳门身份证.台湾身份证及部分国外身份证: 2.识别速度快:单张OCR手机身份证号识别 ...

  8. 身份证OCR识别在远程开户中的应用

    远程开户背景: 传统的金融机构开户需要客户携带身份证件到营业厅进行办理,但是地理位置的限制造成了部分客户群体的不便,随着移动互联网的快速发展,金融行业追求创新,为客户提供更加便利的开户方式.利用金融远 ...

  9. GitChat·人工智能 | 肿瘤医疗影像 AI 识别技术实践

    GitChat 作者:王晓明 更多IT技术分享,尽在微信公众号:GitChat 前言 医学影像与人工智能的结合,是数字医疗领域较新的分支和产业热点.医学影像的解读需要长时间专业经验的积累,医生的培养周 ...

  10. c#和java部署pytorch同事识别两个图片_身份证OCR识别移动端amp;服务器

    摘要:由Web Service和其相关网站接收客户端上传的需要识别的图片.当Web Service接收到图片后将其转发给调度服务器,由任务调度程序再把识别请求分发给空闲的识别服务器,终由Web Ser ...

最新文章

  1. python until怎么用不了_为何你还不懂得如何使用Python协程
  2. 苏联曾经的AI有多强?一段几乎已被世人遗忘的往事
  3. python 如何跳过异常继续执行
  4. 【CMake】CMake 引入 ( Android Studio 创建 Native C++ 工程 | C/C++ 源码编译过程 | Makefile 工具 | CMake 引入 )
  5. 怎么用matlab处理数据,如何用Matlab处理.wfm格式的数据
  6. python调用支付宝支付接口详细示例—附带Django demo代码
  7. linux mkdir绝对路径,linux学习(六)绝对路径、相对路径、cd、mkdir、rmdir、rm(示例代码)...
  8. Linux系统信息与系统资源
  9. SQL数据表字段类型与属性总结(DDL)
  10. SSO的几种跨域方案
  11. SSE图像算法优化系列十四:局部均方差及局部平方差算法的优化。
  12. java调用lingo实例_LINGO使用教程(一)
  13. substrate 学习记录(一):Substrate 安装 + 创建测试链 + 启动私有网络
  14. der解码规则_JAVA解析各种编码密钥对(DER、PEM、openssh公钥) | 学步园
  15. 橘子识别java_Java方法
  16. 短视频媒体怎么用手机去水印
  17. 17个最好用的iPhone数据恢复工具【2019更新】
  18. windows 环境下,可执行 exe 文件和 .dll 文件在不同目录下的处理办法
  19. 侠盗猎车手5 MOD版/Grand Theft Auto V/gta5
  20. vue json转xml

热门文章

  1. 腾讯云+宝塔+tomcat / nginx部署前端代码
  2. Jmeter安装步骤
  3. 电话号码被标记,快速取消教程
  4. Webservice接口开发简单例子
  5. 数据结构严蔚敏(c语言版)课后算法题答案-线性表
  6. python对平面设计有用吗_平面设计有前途吗?
  7. yaahp使用教程_yaahp层次分析法软件
  8. 店宝宝:电商直播被“敲响警钟”了
  9. linux之vmlinux、vmlinuz、System.map和/proc/kallsyms简介
  10. python 颜色大全