Card-Ocr

身份证识别OCR, 从身份证图片中自动提取身份证号。 测试图片来自百度搜索的样例图片。 找到的图片比较少,目前都能正确识别。 可用的数据集个人很难找到。

依赖

opencv

pytesseract

numpy

matplotlib

流程

获取身份证号区域

image-》灰度=》反色=》膨胀=》findContours

数字识别

采用tesseract识别,通过trainfont.py获得traineddata.

trainfont使用

通过autoBox = 1自动生成box文件

trainFont(fontName, fontPath, fontsize, txt, "eng", 0, autoBox=1)

通过jBoxEditor之类的修正box文件

autoBox = 0 生成traineddata

trainFont(fontName, fontPath, fontsize, txt, "eng", 0, autoBox=0)

识别

获取到身份证区域之后,截取身份证号,灰度化,然后交给pytesseract

pytesseract.image_to_string(image, lang='ocrb', config=tessdata_dir_config)

Keras

除了用tesseract,也可以用机器学习的方式训练识别。这里用了Keras with Tensorflow,"开头两套双卷积池化层,后面接一个 dropout 防过拟合,再接两个全链接层,最后一个 softmax 输出结果。" 使用genData.py生成train数据。 截取身份证号之后的图片分割成18个图片,x-predict.png 用kerastrain.py进行预测识别 训练的结果有时候3和5能分清,有时候分不清。 因为没有支持CUDA的显卡,用的CPU训练。

效果

TODO

Keras with Tesorflow 来训练识别

引用

python 身份证识别仪_Card-Ocr:身份证识别 OCR相关推荐

  1. alphac测试和bata测试区别_电缆识别仪与电缆故障测试仪的区别

    湖北中试高测电气控股有限公司为您解答:电缆识别仪与电缆故障测试仪的区别 电缆识别仪与电缆故障测试仪的区别 之前有客户问我,电缆识别仪和电缆故障测试仪是不是也能对电缆进行识别,我想这个用户可能是用过了电 ...

  2. android ocr 身份证识别

    ocr opencv 想必做过程图像识别的同学们都对这两个词不陌生吧. ocr (optical character recognition ,光学字符识别) 是指电子设备(例如扫描仪或数码相机)检查 ...

  3. python用百度云接口实现身份证识别

    python可以通过python+Opencv来实现很多文字识别之类的工作,因为OpenCV库的功能可以说是相当强大,很多功能都可以完成.但是实现起来需要自己造轮子,所以很费时间和精力,我们可以直接学 ...

  4. 调用百度智能云OCR接口识别身份证和户口本

    一.百度智能云获取token类编写 package com.wy.gcserver.ocr.service;import org.slf4j.Logger; import org.slf4j.Logg ...

  5. 阿里云ocr身份证识别接口调用

    1.阿里云界面点击搜索ocr,选择文字识别,开通服务,默认已登录阿里云账号 2.选择个人证件识别,身份证识别(每个月赠送200次体验) 3.点击产品文档 4.下拉到最后,选择RecognizeIdca ...

  6. 阿里云智能身份证OCR文字识别

    智能身份证OCR文字识别 做的项目里面涉及到了身份证识别输入的真实姓名与身份证号码是否匹配功能,于是在阿里云接了智能身份证OCR文字识别API,登录阿里云找到对应的产品,如下图 购买使用然后生成对应的 ...

  7. OCR身份证识别SDK

    在很多地方都需要采集身份证信息,身份证识别OCR则能大大简化信息采集录入的过程.传统手动输入不仅慢,而且容易出错,利用OCR识别技术,则能将繁琐变得高效,将人工变得智能. 身份证识别OCR ,有着数十 ...

  8. 调用腾讯云OCR接口识别身份证和户口本

    一.添加项目pom文件依赖 <dependency><groupId>com.alibaba</groupId><artifactId>fastjson ...

  9. android tensorflow文字识别身份证识别ocr文字识别商用源码

    一 ,文字识别简介 计算机文字识别,俗称光学字符识别,英文全称是Optical Character Recognition(简称OCR),它是利用光学技术和计算机技术把印在或写在纸上的文字读取出来,并 ...

最新文章

  1. oracle中睡眠,sql - ORACLE中的睡眠功能 - 堆栈内存溢出
  2. c语言中10转8和16的转换,(C语言)10进制转换2,8,16进制
  3. 都是基于.NET平台,WPF能取代Winform吗?
  4. Swift - defer关键字(推迟执行)
  5. 奥巴马:乔布斯改变我们每个人看世界的方式
  6. 启蒙英语仍在培育期,DaDaBaby缘何能裂变式增长?
  7. js选中文字兼容性解决
  8. ios 自定义拍照页面_30分钟搞定iOS自定义相机
  9. JavaScript在发送请求AJAX请求时,URL的域名地址是使用绝对地址还是相对地址?
  10. 单层的神经网络使用自定义的损失函数
  11. 详解FSMO的五种角色
  12. 重新认识HTML中的p标签
  13. Ubuntu 普通用户无法启动Google chrome
  14. 节后一起搞学习!聊一聊我在 B 站上自学编程的经历吧
  15. cad二次开发之无法验证该可执行文件的发布者解决方案
  16. Latex论文写作各种小问题
  17. C语言程序设计入门——水仙花数
  18. 越野赛车问题——线段树分治+并查集
  19. P1462 通往奥格瑞玛的道路(二分+dijkstra)
  20. python爬虫百度安全验证_爬虫黑科技-绕开百度人机验证

热门文章

  1. c语言语句ppt,C语言的语句.ppt
  2. Oracle replay工具用法
  3. react-native使用模拟器调试步骤(安卓机)
  4. TMS320F28x的定时器
  5. 欧姆龙CP1H标准程序,一共控制五个伺本体四个+一个轴扩展包含轴点动
  6. html 仿饿了点餐页面,JS实现仿饿了么在浏览器标签页失去焦点时网页Title改变
  7. 找出一个正整数的所有因子(因数)
  8. L13-理解Python中的特殊的返回值-函数
  9. 直播间场控词大全第二期
  10. SQL中 decode()函数