身份证识别-深度学习 -- 精度商用

  • 身份证识别
    • 身份证识别场景
    • 身份证识别的流程
    • 使用效果以及对应的python调用方式
    • 识别效果
    • 接口试用方式
    • 效果交流方式

身份证识别

身份证识别场景

最近在做身份证识别,调研了一些方案,对于一些比较规整,光线、背景、拍照效果比较好的情况下,这种情况下进行检测和识别起来会好很多,但是现在很多情况下,场景比较开放,对于上述的光线、背景、拍照效果没有限制,毕竟每个需要识别的用户在使用的过程中不会关注这些问题,只有疫情下的时候,专门进行身份证录入的工作人员,可能受过培训,他们知道在拍身份证的时候,会把软件的摄取框对准身份证的四个边角,使得背景对识别的任务尽可能小;

身份证识别的流程

  • 证件旋转功能:对上传的图片进行角度旋转,对于用户拍摄的图片,上传到服务器时,图片的旋转方向不固定,有些正好是0度,有些是90度,或者是180度、270度,都有可能,这个时候需要有正确识别当前的证件角度,将证件旋转到正确的位置;
  • 证件位置定位:对于上述场景中描述,场景是自由开放的,这个时候需要能够正确识别出证件的位置和证件的四个角点,并且通过角点对证件的位置进行定位、图像进行转换,将证件能够矫正过来;
  • 文字定位:能够框选出有效的文字区域,对于框选文字,目前的方案比较多,通常采用的有 CTPN、DBNet、EAST、PSE、SAST、FCE、PAN、CRAFT、SegLink等,对于这些网络,效果一般都能达到比较好的效果,对于这个任务,一般采用DBNet网络,相对而言比较简单,也好理解,效果也不错,对于这个阶段,有个问题需要注意下,就是对于不同文字块最好能够区分开,如果将不同字符块的文字框选到一个文字块,在后期的操作过程中就很难进行切分开;
  • 文字识别:通俗的讲,就是将上述识别出来的文字块,进行文字识别,通常采用网络有 CRNN、RARE、SRN、SED、SAR、NRTR、Star、Rossta、SVTR等,一般采用CRNN,结构相对比较简单,效果也比较好,对于3w字形进行训练,都能达到比较好的效果
  • 后处理过程:通常采用采用模版匹配的方式,这种方式如果对于比较清晰的图片识别匹配,效果不错,但是对于一些效果比较模糊的图片处理,主要关键字都能识别错误,所以匹配的时候就需要通过其他的字段来进行辅助定位矫正、识别;

思考:对于上述的问题,后期可以通过‘文字定位’阶段进行解决,即文字定位的同时,能够正确判断哪些字段分别属于那种类型字段,再加以后处理;

使用效果以及对应的python调用方式

import requestsurl = "https://frp-cup.top:63320/predict"payload={'nMsgType': '200',
'sU': 'hello_verify',
'sP': 'hello_verify',
'sS': '0',
'Category': '200',
'SubCategory': '0'}
files=[('image',('1440w.jpg',open('身份证图片.jpg','rb'),'image/jpeg'))
]
headers = {}response = requests.request("POST", url, headers=headers, data=payload, files=files)print(response.text)

识别效果

目前识别率平均能达到95%+

接口试用方式

接口已经开放,调用方式详见 github … …

https://github.com/MaverickMuzi/CertificateIdentification

效果交流方式

感兴趣的伙伴可以一起交流:
ghost_man_evil@126.com
w_|_x: tinalee_muzi

身份证识别(深度学习)-- 精度商用相关推荐

  1. 虹膜识别 深度学习 学习总结

    深度学习在虹膜识别中有哪些应用?上下两个博客 上:https://zhuanlan.zhihu.com/p/42697217 生物识别技术的发展趋势有多模态生物识别,生物防伪,深度学习技术的应用等. ...

  2. 图像抠图去背景技术从传统算法到深度学习到商用:如何快速使用JAVA/PHP/Python/ShellCommand 实现人像抠图去背景-调用PicUP.AI抠人像接口API实现人像抠图

    图像抠图去背景技术从传统算法到深度学习 图像去背景(抠图)是图像编辑中的关键技术 三分图(trimap)的概念 PicUP.AI [链接](https://www.picup.ai). 实测例子 AP ...

  3. 4.1 什么是人脸识别-深度学习第四课《卷积神经网络》-Stanford吴恩达教授

    ←上一篇 ↓↑ 下一篇→ 3.11 总结 回到目录 4.2 One-Shot 学习 什么是人脸识别 (What is face recognition?) 欢迎来到第四周,即这门课卷积神经网络课程的最 ...

  4. 深度学习精度提升 3 个小妙招:模型集成、知识蒸馏、自蒸馏

    本文转载自 AI公园. 作者:Zeyuan Allen-Zhu 编译:ronghuaiyang 导读 训练好的模型,用自己蒸馏一下,就能提高性能,是不是很神奇,这里面的原理到底是什么呢,这要从模型集成 ...

  5. 基于病害区域图像的植物病害识别深度学习(创新点好理解)

    Deep Learning for Plant Disease Identification from Disease Region Images 1.摘要解读 [目的]提出了一种利用病理分割的病害区 ...

  6. 时间序列分类01:人类活动识别深度学习模型综述

    [时间序列预测/分类] 全系列60篇由浅入深的博文汇总:传送门 本文介绍了人类活动识别相关领域的建模方法和理论研究. 文章目录 前言 相关论文 1. 人类活动识别简介 2. 使用神经网络进行建模的优势 ...

  7. 作业6:基于CNN的XO识别 深度学习 手搓卷积代码

    目录 一.实现卷积 池化 激活 代码 1.numpy版本 生成图像 卷积核生成 卷积操作 池化操作 最大池化 平均池化 激活操作 2.pytorch版本(利用pytorch框架) 2.1相关函数 2. ...

  8. 达摩院视觉AI训练营-搭建身份证识别系统-学习笔记

    搭建身份证识别系统目录 一.成为开发者 二.能力调试 三.能力开通 四.创建AccessKey 五.启动开发 参考案例 总结 一.成为开发者 请您使用阿里云账号登录阿里云视觉智能开放平台.如还未持有阿 ...

  9. 毕业设计 - 题目:基于深度学习卷积神经网络的花卉识别 - 深度学习 机器视觉

    文章目录 0 前言 1 项目背景 2 花卉识别的基本原理 3 算法实现 3.1 预处理 3.2 特征提取和选择 3.3 分类器设计和决策 3.4 卷积神经网络基本原理 4 算法实现 4.1 花卉图像数 ...

  10. 文档识别深度学习OCR

    现如今整个IT行业圈都在说什么Deeplearning.神经网络.深度学习,各行各业都搞起了这方面的业务,现在搞得最出色的,百度无疑,同时腾讯.阿里也不甘落后的紧随其后,甚至在某些方面,比百度做的还要 ...

最新文章

  1. Log信息获取调用类和调用方法名的实现原理
  2. codeforces D Prefixes and Suffixes(kmp)
  3. 创建emp表 oracle,Oracle中创建和管理表详解
  4. 【NLP】竞赛中的文本相似性!
  5. 【嵌入式】Modbus TCP功能码
  6. 【python】入门指南:控制语句
  7. 微信小程序 小程序登陆功能
  8. 最近对项目代码做的一些更改和感想
  9. 0301——SearchController
  10. 腾讯2019秋招笔试真题
  11. ckeditor 图片上传_开发问题:Django使用ckeditor上传到七牛云
  12. python爬去segementfault上的博客文章
  13. cygwin+hadoop+eclipse (三) 运行wordcount实例
  14. 物联网感知-高压直流长距离供电在线实时监测(光纤传感技术)
  15. Java语言之Integer类
  16. C#: PDF转图片(ghostscript)
  17. 一文读懂参考基因组和基因组注释+最全下载方法
  18. 电脑很大,电脑内存很大为什么还是很卡
  19. WSUS客户端错误日志收集与持续更新!
  20. 内存卡android文件夹名称,安卓手机内存卡文件夹英文名称解析——第三方应用类...

热门文章

  1. 以ChatGPT辅助软件架构工作
  2. 为了取悦消费者,媒体娱乐行业有多努力?
  3. sizeof函数的用法
  4. 【JLPT N1】2010年7月
  5. 分子生物学之分子结构
  6. Ubuntu 配置 远程桌面 ssh
  7. postfix 邮箱搭建
  8. java sha256 实现_JAVA SHA256加密代码实现
  9. 牛鑫宇老师9月26号为重庆某银行讲授《22年税务新政解析与税务风险防范对》课程现场分享
  10. [一车大师]微信运营心得