上一篇检测模型训练https://blog.csdn.net/weixin_42845306/article/details/112689152
飞桨的OCR模型分为检测、识别和分类，今天讨论识别。
ORC的识别，就是给定一张剪辑好的图片，这个图片只有一串纯文本，计算机将图片里的内容识别出来。
要识别的图片：

OCR的识别和目标识别差不多，都是把猫的图片识别成猫，狗的图片识别成狗

数据集准备

进入正题
自定义图片标注的方法上一篇讲过，产生的文件包含一个充满了图片的文件夹crop_img和对应的识别标签rec_gt.txt，这两个就是识别的数据集和标签。

这回用一下别人现成的数据集：icdar2015
可以在官网上注册下载，也可以在我的网盘下载：
链接：https://pan.baidu.com/s/1dib-9dgjLssCu9dlwuYjig
提取码：gy57

注意这个数据集的标签格式与飞桨的读取格式不兼容，需要转换，参考
https://github.com/PaddlePaddle/PaddleOCR/blob/dygraph/doc/doc_ch/recognition.md
云盘分享的已经包含转换后的标签。

数据集安置

在PaddleOCR-dygraph根目录下建立一个文件夹"train_data"，再新建一个文件夹"ic2015_data"作为数据集存放的位置，在ic2015_data里放入训练集和测试集的标签和对应的两个文件夹的图片（只放图片）。

预训练模型安置

可以从网上下载预训练模型，比如https://paddleocr.bj.bcebos.com/dygraph_v2.0/en/rec_mv3_none_bilstm_ctc_v2.0_train.tar

将解压后的模型文件夹放在PaddleOCR-dygraph下新建的pretrain_models文件夹中，操作同上篇文章。

调参

找到rec_icdar15_train.yml，这是识别模型的参数训练设置，记事本打开。
里面的参数看着改，主要是图片文件夹和标签文件路径：
data_dir: ./train_data/ic2015_data
label_file_list: ["./train_data/ic2015_data/rec_gt_train.txt"]
如果有预训练模型，还要改pretrained_model路径
注意测试集和训练集的路径都要调整。

训练开始

在PaddleOCR-dygraph根目录打开cmd，输入以下命令即可测试

python -m paddle.distributed.launch tools/train.py -c configs/rec/rec_icdar15_train.yml

训练进行中：
识别模型的效果可以看这篇文章：https://blog.csdn.net/weixin_42845306/article/details/113832699

一切都可以从手册学到https://github.com/PaddlePaddle/PaddleOCR/blob/dygraph/doc/doc_ch/detection.md

PaddlePaddle飞桨OCR文本检测——识别模型训练（三）相关推荐

PaddlePaddle飞桨OCR文本检测——识别图片文字结果并保存为txt（五）
此部分只考虑rec识别部分,不考虑检测和方向分类. 举个栗子,要识别的图片如下所示: 打码了,第一次发布的时候csdn说我打广告-- 这是paddle自带的图片,也是det检测后的框出来的图片,可以看 ...
PaddlePaddle飞桨OCR文本检测——更改模型保存间隔（六）
先看配置文件中关于保存的参数 epoch_num: 总的训练轮数 print_batch_step: 每隔多少个batch打印一回信息 save_model_dir: 模型保存路径 save_epoc ...
PaddlePaddle飞桨OCR文本检测——检测模型训练（二）
上一篇安装https://blog.csdn.net/weixin_42845306/article/details/112688405 飞桨的OCR模型分为检测.识别和分类,先看检测. 检测就是将( ...
PaddlePaddle飞桨OCR文本检测——入门安装GPU版（一）
首先放上github上的开源代码网址,里面的帮助文档说的非常详细: https://github.com/PaddlePaddle/PaddleOCR/ 环境安装 python中环境使用pip安装: ...
商汤OCR文本检测+识别开源(FOTS),TF实现NBA记分牌识别
向AI转型的程序员都关注了这个号???????????? 机器学习AI算法工程公众号:datayx 常见的深度学习OCR过程中,会把文本检测与文本识别拆分成两个部分,通过先检测后识别的方法对图片 ...
百度PaddlePaddle使用飞桨搭载手写字识别并训练、预测
文章目录通过极简方案构建手写数字识别模型一.导入库二.数据处理三.网络模型设计四.训练配置以及模型训练 **==这里特殊之处在于读取数据的方式采取飞桨自带数据读取器==** 五.模型测试 = ...
截屏就可以转文字？飞桨带您体验OCR超轻量中英文识别模型
[飞桨开发者说]陈千鹤,华中科技大学计算机科学与技术学院大一在读任务背景目前很多实用小工具都趋向收费模式,即使免费,不是功能不完整,就是有很多约束条件,在应用时效果无法达到我们的预期.于是我萌生一 ...
Python 利用飞桨OCR、layoutparser、TensorFlow对票据进行表格检测和识别
draft-detect 运行环境: Windows10 系统 6核6线程 16G内存基于 Python3.8 版本 vitualenv 虚拟环境 1.安装依赖先创建虚拟环境,基于Python3. ...
飞桨OCR打标、训练、预测、部署全流程
注:本文档全部在Windows10环境下操作注:本文档使用的飞桨OCR全景项目代码版本为 release/2.4 查询文档列表: 飞桨OCR官方中文文档:https://github.com/Pad ...

PaddlePaddle飞桨OCR文本检测——识别模型训练（三）

数据集准备

数据集安置

预训练模型安置

调参

训练开始

PaddlePaddle飞桨OCR文本检测——识别模型训练（三）相关推荐

最新文章

热门文章