上一篇检测模型训练https://blog.csdn.net/weixin_42845306/article/details/112689152
飞桨的OCR模型分为检测、识别和分类,今天讨论识别。
ORC的识别,就是给定一张剪辑好的图片,这个图片只有一串纯文本,计算机将图片里的内容识别出来。
要识别的图片:

OCR的识别和目标识别差不多,都是把猫的图片识别成猫,狗的图片识别成狗

数据集准备

进入正题
自定义图片标注的方法上一篇讲过,产生的文件包含一个充满了图片的文件夹crop_img和对应的识别标签rec_gt.txt,这两个就是识别的数据集和标签。

这回用一下别人现成的数据集:icdar2015
可以在官网上注册下载,也可以在我的网盘下载:
链接:https://pan.baidu.com/s/1dib-9dgjLssCu9dlwuYjig
提取码:gy57

注意这个数据集的标签格式与飞桨的读取格式不兼容,需要转换,参考
https://github.com/PaddlePaddle/PaddleOCR/blob/dygraph/doc/doc_ch/recognition.md
云盘分享的已经包含转换后的标签。

数据集安置

在PaddleOCR-dygraph根目录下建立一个文件夹"train_data",再新建一个文件夹"ic2015_data"作为数据集存放的位置,在ic2015_data里放入训练集和测试集的标签和对应的两个文件夹的图片(只放图片)。

预训练模型安置

可以从网上下载预训练模型,比如https://paddleocr.bj.bcebos.com/dygraph_v2.0/en/rec_mv3_none_bilstm_ctc_v2.0_train.tar

将解压后的模型文件夹放在PaddleOCR-dygraph下新建的pretrain_models文件夹中,操作同上篇文章。

调参


找到rec_icdar15_train.yml,这是识别模型的参数训练设置,记事本打开。
里面的参数看着改,主要是图片文件夹和标签文件路径:
data_dir: ./train_data/ic2015_data
label_file_list: ["./train_data/ic2015_data/rec_gt_train.txt"]
如果有预训练模型,还要改pretrained_model路径
注意测试集和训练集的路径都要调整。

训练开始

在PaddleOCR-dygraph根目录打开cmd,输入以下命令即可测试

python -m paddle.distributed.launch tools/train.py -c configs/rec/rec_icdar15_train.yml

训练进行中:
识别模型的效果可以看这篇文章:https://blog.csdn.net/weixin_42845306/article/details/113832699

一切都可以从手册学到https://github.com/PaddlePaddle/PaddleOCR/blob/dygraph/doc/doc_ch/detection.md

PaddlePaddle飞桨OCR文本检测——识别模型训练(三)相关推荐

  1. PaddlePaddle飞桨OCR文本检测——识别图片文字结果并保存为txt(五)

    此部分只考虑rec识别部分,不考虑检测和方向分类. 举个栗子,要识别的图片如下所示: 打码了,第一次发布的时候csdn说我打广告-- 这是paddle自带的图片,也是det检测后的框出来的图片,可以看 ...

  2. PaddlePaddle飞桨OCR文本检测——更改模型保存间隔(六)

    先看配置文件中关于保存的参数 epoch_num: 总的训练轮数 print_batch_step: 每隔多少个batch打印一回信息 save_model_dir: 模型保存路径 save_epoc ...

  3. PaddlePaddle飞桨OCR文本检测——检测模型训练(二)

    上一篇安装https://blog.csdn.net/weixin_42845306/article/details/112688405 飞桨的OCR模型分为检测.识别和分类,先看检测. 检测就是将( ...

  4. PaddlePaddle飞桨OCR文本检测——入门安装GPU版(一)

    首先放上github上的开源代码网址,里面的帮助文档说的非常详细: https://github.com/PaddlePaddle/PaddleOCR/ 环境安装 python中环境使用pip安装: ...

  5. 商汤OCR文本检测+识别开源(FOTS),TF实现NBA记分牌识别

    向AI转型的程序员都关注了这个号???????????? 机器学习AI算法工程   公众号:datayx 常见的深度学习OCR过程中,会把文本检测与文本识别拆分成两个部分,通过先检测后识别的方法对图片 ...

  6. 百度PaddlePaddle使用飞桨搭载手写字识别并训练、预测

    文章目录 通过极简方案构建手写数字识别模型 一.导入库 二.数据处理 三.网络模型设计 四.训练配置以及模型训练 **==这里特殊之处在于读取数据的方式采取飞桨自带数据读取器==** 五.模型测试 = ...

  7. 截屏就可以转文字?飞桨带您体验OCR超轻量中英文识别模型

    [飞桨开发者说]陈千鹤,华中科技大学计算机科学与技术学院大一在读 任务背景 目前很多实用小工具都趋向收费模式,即使免费,不是功能不完整,就是有很多约束条件,在应用时效果无法达到我们的预期.于是我萌生一 ...

  8. Python 利用飞桨OCR、layoutparser、TensorFlow对票据进行表格检测和识别

    draft-detect 运行环境: Windows10 系统 6核6线程 16G内存 基于 Python3.8 版本 vitualenv 虚拟环境 1.安装依赖 先创建虚拟环境,基于Python3. ...

  9. 飞桨OCR打标、训练、预测、部署全流程

    注:本文档全部在Windows10环境下操作 注:本文档使用的飞桨OCR全景项目代码版本为 release/2.4 查询文档列表: 飞桨OCR官方中文文档:https://github.com/Pad ...

最新文章

  1. 《精通Python设计模式》学习结构型之MVC模式
  2. PHP - 解决中文乱码问题
  3. boost::copy相关的测试程序
  4. android 理解Fragment生命周期
  5. 软考信息系统监理师第五次作业
  6. java异常——异常分类+声明已检查异常+如何抛出异常+自定义异常类
  7. 简述一下索引的匹配原则_【进阶之路】索引中一些易忽视的点
  8. postman - github下载地址
  9. poj3204Ikki's Story I - Road Reconstruction(最大流求割边)
  10. jquery学习笔记之选择器
  11. void指针(void*)用法
  12. Atitit r2017 r4 doc list on home ntpc.docx 驱动器 D 中的卷是 p2soft 卷的序列号是 9AD0-D3C8 D:\ati ext\r2017
  13. IE6下的Aborted解决办法
  14. iPhone手机分辨率
  15. 我认为还算经典的语录
  16. echarts中国省份地图加城市定位(打点)
  17. 幼儿剑桥英音版Super Safari123级别学生书PDF+练习册PDF+教师书PDF+白板课件
  18. demo:猜数字小游戏
  19. 神通数据库自助在线查询
  20. data:image/png;base64,iVBORw0KGg... 表示的是一张图片

热门文章

  1. 怎么打开/查看MySQL的SQL记录
  2. JS数组操作之增删改查
  3. [Android Pro] 判断Uri对应的ContentProvider所操作的数据库u存在,及DownloadManager的暂停,继续...
  4. 理解CSRF(跨站请求伪造)
  5. LVS-DR负载均衡-02
  6. 搭建LAMP架构之Apache2.4.4安装及管理
  7. 一级计算机技术,《一级考试大参考》自动化技术、计算机技术.pdf
  8. python编程入门第一课教案_python编程从入门到实践 第一课:输入输出
  9. js 调用c语言函数看,web前端:JS高级---函数中的this的指向,函数的不同调用方式...
  10. Arduino十大滤波算法程序大全(精编无错版)