数码管数字识别方法整理

  • 图像任务
    • OCR任务
    • 图像分类
    • 目标检测
    • 图像分割
    • 图像增强
    • 视频任务
  • 正文: OCR——数码管数字识别方法整理
    • 文本检测+ 字符分割+ 单数字识别
      • 参考资料:
      • 参考博客:
      • 参考代码
      • 使用工具
      • 常见挑战
      • 比赛(数据)
      • 文本检测DB: Real-time Scene Text Detection with Differentiable Binarization
      • cook
    • 文本检测+ 序列识别
      • 序列识别 CRNN == CNN +RNN +CTC
      • 序列识别—— 基于attention文字识别
    • tessernet工具/  百度API工具

图像任务


OCR任务

参考博客:
CV综述OCR任务—目录

图像分类

构建我的classification框架记录

目标检测

参考CV综述目标检测整理—目录

图像分割

参考CV综述图像分割整理—目录

图像增强

  • 传统方法增强对比度等
  • SR任务

视频任务

  • 目标跟踪

正文: OCR——数码管数字识别方法整理


文本检测+ 字符分割+ 单数字识别

待测方法:
利用颜色信息,尝试使用R通道进行字符分割。

参考资料:

《halcon机器视觉算法原理与编程实战》 by杨青
《数字图像处理第三版》

参考博客:

CV综述OCR任务—目录
数码管数字识别

参考代码

MhLiao/DB
数码管数字识别

使用工具

  • labelme
  • paddleocr

常见挑战

  • 图像质量不清晰,干扰因素多,不均匀光照,反光等问题
  • 表盘种类多,对于不同表,不同位数需要采用不同的方法
  • 现有数据太少,需要自己收集并处理数据
  • 模型处理速度慢,需要对代码和模型进行优化

比赛(数据)

  • ICDAR2015

文本检测DB: Real-time Scene Text Detection with Differentiable Binarization

论文: Real-time Scene Text Detection with Differentiable Binarization
源码:
MhLiao/DB
参考博客:
《DB:Real-time Scene Text Detection with Differentiable Binarization》论文笔记

特点:

  • 参考paddleocr中的检测模型,效果比较好

cook

  • 第一步:采集200张数码管图片数据,使用labelme进行polymoid文本框标注,生成json格式文件; 编写json2txt.py生成 .txt标注文件,整理生成icdar2015 格式数据集。加入到icdar2015数据集中(不知道icdar2015数据集是否有必要加入训练中
(torchpy36) air@air-System-Product-Name:~/model-train/OCR/DB/datasets$ python json2txt.py
(torchpy36) air@air-System-Product-Name:~/model-train/OCR/DB/datasets$ python getFilenames.py
  • 参考MhLiao/DB,服务器训练db检测模型,在gtx2080ti上训练1200epoch需要两三天的时间。训练完毕后测试效果。
(torchpy36) air@air-Server:/mnt/zxx_dir/model-train/OCR/DB$ CUDA_VISIBLE_DEVICES=0 python train.py experiments/seg_detector/ic15_resnet50_deform_thre.yaml --num_gpus 1
  • 思路先用db做检测生成框,筛选出数码管显示的框框,根据数码管位数,将框平均切分,获得单字符,单字符二值化,通过数字识别模型做20个类别的分类.(0-9)/0.-9.)
(tf13py36) air@air-System-Product-Name:~/model-train/OCR/tube_digit_recognization-master$ python train.py
  • 获得单字符的数据集: 先从标注的数据集中获得带有数码管显示的框框的图片,再通过get_rec_datas.py根据数码管位数均分(这种方法很有局限性,因为有的数码管是液晶屏幕,位数不定,使用均分法是很笨的方法不够灵活)
(torchpy36) air@air-System-Product-Name:~/model-train/OCR/DB/datasets/train$ python get_rec_datas.py

文本检测+ 序列识别

序列识别 CRNN == CNN +RNN +CTC

论文: An End-to-End Trainable Neural Network for Image-based Sequence Recognition and Its Application to Scene Text Recognition @20150721
源码: meijieru/crnn.pytorch
特点:

  • 每次都要计算概率,速度慢
  • end to end识别

参考博客
CRNN算法详解

序列识别—— 基于attention文字识别

attention_ocr


tessernet工具/  百度API工具

论文:
源码:
特点:

数码管数字识别方法整理相关推荐

  1. 实战 | 计算器/数码管数字识别 基于OpenCV和EasyOCR/PaddleOCR(附源码)

    点击下方卡片,关注"OpenCV与AI深度学习"公众号! 视觉/图像重磅干货,第一时间送达! 导读 本文主要介绍一个计算器显示数字识别的OCR实例,基于OpenCV和EasyOCR ...

  2. 基于Tesseract训练的数字识别研究

    征地档案数字识别研究与应用 1 永州市自然资源与规划勘测事务中心 湖南 永州425000 摘要:针对征地档案数据整理建库工作中界址点坐标电子数据缺失现象,当前主要通过人工识别档案资料并且将坐标数据抄录 ...

  3. LED数码管数字数据集

    LED数码管数字数据集,结合百度OCR取得很好效果 数据集结合百度的OCR百度的OCR:https://gitee.com/paddlepaddle/PaddleOCR/tree/release/2. ...

  4. MATLAB--基于BP神经网络的手写数字识别

    MATLAB–基于BP神经网络的手写数字识别 在干活的过程中整理下来的,希望对大家有帮助. 手写数字识别技术作为图像处理和模式识别中的研究热点,在大规模数据统计(如行业年检.人口普查等).票据识别.财 ...

  5. 基于matlab数字识别算法系统设计与实现(含源文件)

    欢迎添加微信互相交流学习哦! 项目源码:https://gitee.com/oklongmm/biye 目 录 内容摘要------------------------------1 关键字----- ...

  6. 一文详解opencv摄像头数字识别

    OpenCV数字识别 一.数字识别的两种方式 1.1 轮廓提取法 1.2 行列扫描法 二.提取图像中的ROI区域 2.1 读取摄像头图像 2.2 对图像进行二值化处理 2.3 形态学处理 2.4 设置 ...

  7. MATLAB仪表表盘数字识别

    MATLAB仪表表盘数字识别 摘要 针对无指针式仪表表盘的数字识别问题,提出一种基于特征提取和粗糙集特征约简的神经网络数字识别方法.该方法 首先利用数字图像预处理技术处理图像并利用特征提取方法提取数字 ...

  8. 基于TensorFlow深度学习框架,运用python搭建LeNet-5卷积神经网络模型和mnist手写数字识别数据集,设计一个手写数字识别软件。

    本软件是基于TensorFlow深度学习框架,运用LeNet-5卷积神经网络模型和mnist手写数字识别数据集所设计的手写数字识别软件. 具体实现如下: 1.读入数据:运用TensorFlow深度学习 ...

  9. FPGA实现数字识别

    文章目录 一.数字识别方法 二.画线取交点特征的方法 三.总体测试框图 提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 一.数字识别方法 二.画线取交点特征的方法 三.总体 ...

最新文章

  1. [C] Bellman-Ford边松弛:解决负权边
  2. SQL Server :DBLINK创建及使用
  3. Java 7 并发编程指南
  4. 使用VS2008进行WEB负载测试
  5. ALEIDoc EDI(6)--Filter Conversion
  6. 如何将外部邮箱添加至Exchange邮件组中
  7. rust军用船指令_RUST物品指令清单(英文版)
  8. 聚类、K-Means、例子、细节
  9. gbase迁移mysql_基于datax实现从gbase到mysql的数据迁移--时间字段篇
  10. jconsole是否可以在生产环境使用_jconsole使用
  11. 基于线程池技术的web服务器
  12. 计算机学情分析案例,小学信息技术课学情分析
  13. Java 生成各种 PDF 实战方案(图片、模板、表格)
  14. Charles 乱码解决办法
  15. Redis之事务的实现
  16. 推荐5款Windows桌面效率工具
  17. [Discuz!] 头像HTML5上传 1.2 (saya_avatarupload)支持手机版
  18. C语言编译、链接简介
  19. 内存不能为read修复方法
  20. 【广告算法工程师入门 5】百度搜索引擎变现策略指标体系

热门文章

  1. java程序员开发app使用uni-app必看文档!
  2. 中国市场的三因子模型简单实践(1)_基于python(简单使用)
  3. TDA4 QNX SDK
  4. Java 24小时进制转为12小时进制
  5. 我要偷偷学Java,然后惊呆所有人!
  6. JavaScript Promise对象详解
  7. 再论802.11ax trigger机制和帧格式-笔记
  8. abaqus要求计算机配置,Abaqus对电脑硬件配置要求-元王科技(feaworks)
  9. 故障处理 软件 需求_「行业知识」地铁车辆故障智能处理分析
  10. jquery导出word(页码,边距设置)