基于CRNN的文本字符验证码识别

本项目链接,欢迎大家Fork:https://aistudio.baidu.com/aistudio/projectdetail/3501451

Paddle学习资料:

1.Paddle​​​​​​学习地址:​​​​​​飞桨AI Studio - 人工智能学习与实训社区

2.AI Studio基本操作(一) Notebook篇

3.飞桨框架文档

4.PaddleOCR学习–Github

5.十分钟掌握PaddleOCR使用

本次通过AI达人创造营学习PaddlePaddle基本使用,并参考其他开源项目完成PaddleOCR比赛实战。接下来将介绍使用Paddle进行验证码识别比赛及具体训练流程。

比赛链接

2022数字中国创新大赛(简称2022 DCIC)科技金融子赛道——基于文本字符的交易验证码识别

1 比赛简介

1.1 赛题背景:

验证码作为性价较高的安全验证方法,在多场合得到了广泛的应用,有效地防止了机器人进行身份欺骗,其中,以基于文本字符的静态验证码最为常见。随着使用的深入,噪声点、噪声线、重叠、形变等干扰手段层出不穷,不断提升安全防范级别。RPA技术作为企业数字化转型的关键,因为其部署的非侵入式备受企业青睐,验证码识别率不高往往限制了RPA技术的应用。一个能同时过滤多种干扰的验证码模型,对于相关自动化技术的拓展使用有着一定的商业价值。

1.2 赛题背景:

验证码作为性价较高的安全验证方法,在多场合得到了广泛的应用,有效地防止了机器人进行身份欺骗,其中,以基于文本字符的静态验证码最为常见。随着使用的深入,噪声点、噪声线、重叠、形变等干扰手段层出不穷,不断提升安全防范级别。RPA技术作为企业数字化转型的关键,因为其部署的非侵入式备受企业青睐,验证码识别率不高往往限制了RPA技术的应用。一个能同时过滤多种干扰的验证码模型,对于相关自动化技术的拓展使用有着一定的商业价值。

1.3 赛题任务:

本次大赛以已标记字符信息的实例字符验证码图像数据为训练样本,参赛选手需基于提供的样本构建模型,对测试集中的字符验证码图像进行识别,提取有效的字符信息。训练数据集不局限于提供的数据,可以加入公开的数据集。

2 数据与评测

2.1 数据简介

此次比赛为选手提供15000张带标注信息的训练数据集,每张训练数据都是包含一个4位文本字符的验证码图像,并对当前图像中的文本字符进行了标注;测试数据集含25000张验证码图像。

2.2 数据说明

提供训练数据集打包文件train_imgs.zip(文件名称即对应该图片文本字符标签);提供测试数据集打包文件test_imgs.zip,测试数据集包含待识别的图像文件。

文件名称 说明
train_imgs.zip 训练集图片,包含15000张验证码图片
test_imgs.zip 测试集图片,里面包含25000张待识别验证码图片
submit_example.csv 提交样例,参赛者参考此数据格式进行提交

2.3 评测标准

本次比赛采用评价方式为准确率(accuracy),对于参赛者提交的结果,要求完全识别出完整的验证码文本信息,最终根据测试图像数据预测的准确率进行从高到低的排序。
同等准确率的以提交结果的时间排名,先提交者胜出。

P(准确率)=所有待检测的目标数量/检测正确的目标数量P( 准确率 )= 所有待检测的目标数量 /检测正确的目标数量 P(准确率)=所有待检测的目标数量/检测正确的目标数量

3 构建训练集和验证集

数据集链接

基于CRNN的文本字符交易验证码识别--Paddle实战相关推荐

  1. 基于深度学习的图标型验证码识别系统

    深度学习应用于图像处理领域应该说有很长一段时间了,相关的研究成果也有很多的积累了,从项目和实践入手是我觉得的最好最快速有效的学习手段,当下很多主流的验证码识别系统大都是基于神经网络设计开发而来的,在处 ...

  2. 基于深度学习的图标型验证码识别系统(包含完整代码、界面)

    深度学习应用于图像处理领域应该说有很长一段时间了,相关的研究成果也有很多的积累了,从项目和实践入手是我觉得的最好最快速有效的学习手段,当下很多主流的验证码识别系统大都是基于神经网络设计开发而来的,在处 ...

  3. Python字符型验证码识别

    字符型验证码 1. 什么是验证码 在开发爬虫的过程中会遇到一种常见的反爬措施,验证码.验证码(CAPTCHA)是"Completely Automated Public Turing tes ...

  4. 省钱利器!基于TensorFlow的端到端验证码识别

    最近机器学习很热,作为机器学习在图像识别方面最火的研究领域,神经网络将图像识别带入了新的高度,很多之前还只能在实验室中的理想情况下的成果,目前已经大量的运用在了实际生产环境中了,了解一些神经网络的知识 ...

  5. 基于SVM的python简单实现验证码识别

    1. 爬取验证码图片 from urllib import requestdef download_pics(pic_name):url = 'http://wsbs.zjhz.hrss.gov.cn ...

  6. 【DCIC2022】科技金融子赛道验证码识别0.65+ baseline

    刚开始做OCR比赛,周末补了下相关知识,主要参考内容来自[官方]十分钟掌握PaddleOCR使用,不过目前分数不是很高,0.65+,主要存在过拟合问题,大家可以再修改配置或者模型再微调下,这里主要给大 ...

  7. 基于Python的简单验证码识别

    原文链接:有图有真相 摘要:验证码在网络安全方面发挥着关键作用,验证码的主要目的是区分人类和计算机,用来防止自动化脚本对网站的一些恶意行为.目前绝大多数网站都利用验证码来阻止恶意脚本程序的入侵.验证码 ...

  8. 字符型图片验证码识别完整过程及Python实现

    1   摘要 验证码是目前互联网上非常常见也是非常重要的一个事物,充当着很多系统的 防火墙 功能,但是随时OCR技术的发展,验证码暴露出来的安全问题也越来越严峻.本文介绍了一套字符验证码识别的完整流程 ...

  9. 自动交易软件中的股票自动交易通达信验证码识别 C# (一)

    (一)股票自动化交易-通达信交易验证码识别方法 C#语言 如图所示,在使用外挂式自动化交易中,在通达信软件上通常会出现类似这样是验证提示,是因为软件检测到了外挂软件的行为,所以出现验证提示. 而为了解 ...

最新文章

  1. android 自定义打包,android 自定义打包后的app名称
  2. 应用名称本地化/国际化
  3. Redis的RDB文件与AOF文件
  4. 第七节:框架搭建之页面静态化的剖析
  5. Linux内核分析 - 网络[三]:从netif_receive_skb()说起
  6. Dns信息收集工具集合
  7. 服务器需不需要虚拟内存,服务器要不要虚拟内存
  8. Access——SQL语言查询
  9. 基于WEB的网上购物系统的设计与实现(附:源码 论文 sql文件)
  10. ps教程全套|零基础教程-高阶教程快速入门
  11. Ubuntu安装Ruby
  12. 《听闻远方有你》简谱-刘均演唱
  13. 房多多2020年财报:再度录得亏损,第四季度毛利率骤降至8%
  14. Gartner 发布2022年新兴技术成熟度曲线
  15. OL3-Cesium 二三维鼠标事件统一处理
  16. 汇编指令lmm_动画视频角色的LMM神经网络
  17. UnicodeEncodeError: ‘gbk‘ codec can‘t encode character ‘\xa0‘ in position 21: illegal multibyte sequ
  18. 解决CSS中display: inline-block有缝隙问题
  19. win7 64位下利用u盘重装系统
  20. 【rdma_cm】rdma_cm API

热门文章

  1. Centos6.5搭建mongodb分片
  2. phalapi-进阶篇3(自动加载和拦截器)
  3. CentOS利用LVM实现磁盘弹性扩容
  4. shell中的重定向(21)
  5. 转:expect的基本用法 - Shell - ChinaUnix.net -
  6. 图形学的几个非常有用的转换
  7. 《Effective Java》阅读笔记
  8. 程序员面试金典——4.1二叉树平衡检查
  9. 剑指offer——面试题4:替换空格
  10. ssd训练时提示:Cannot copy param 0 weights from 'xxxx',以及提示No module named caffe.proto,推理时设置GPU模式