PaddleOCR 识别器自带了数据增强方法,如何开启呢?
参照:rec_chinese_common_train_v2.0.yml配置文件。
增加- RecAug: 字段,例如:

Train:dataset:name: SimpleDataSetdata_dir: ./train_data/rec/label_file_list: ["./train_data/rec/rec_gt_train.txt"]transforms:- DecodeImage: # load imageimg_mode: BGRchannel_first: False- RecAug: - CTCLabelEncode: # Class handling label- RecResizeImg:image_shape: [3, 32, 320]- KeepKeys:keep_keys: ['image', 'label', 'length'] # dataloader will return list in this orderloader:shuffle: Truebatch_size_per_card: 32drop_last: Truenum_workers: 0


增强方法在PaddleOCR-release-2.4/ppocr/data/imaug/rec_img_aug.py里面。
代码如下:

class RecAug(object):def __init__(self, use_tia=True, aug_prob=0.4, **kwargs):self.use_tia = use_tiaself.aug_prob = aug_probdef __call__(self, data):img = data['image']img = warp(img, 10, self.use_tia, self.aug_prob)data['image'] = imgreturn data

PaddleOCR 识别器数据增强相关推荐

  1. 深度学习--TensorFlow(7)拟合(过拟合处理)(数据增强、提前停止训练、dropout、正则化、标签平滑)

    目录 拟合 1.拟合情况 2.抵抗过拟合方法 过拟合处理(防止过拟合): 一.数据增强 1.设置图像生成器 2.载入图片 3.图像转三维数据 4.三维转四维 5.生成图片(用图像生成器) 代码 二.提 ...

  2. 二、深度学习数据增强方法汇总

    深度学习模型训练数据增强方法汇总 一.随机裁剪 二.RGB-->BGR通道互换 三.仿射变换(缩放) 三.随机旋转 四.对比度调整 五.随机抠图 六.bound box 中心点随机抠图 七.随机 ...

  3. CV08-数据预处理与数据增强

    复现车道线分割项目(Lane Segmentation赛事说明在这里),学习数据预处理和数据增强.学习分为Model.Data.Training.Inference.Deployment五个阶段,也就 ...

  4. nlp文本数据增强_如何使用Texthero为您的NLP项目准备基于文本的数据集

    nlp文本数据增强 Natural Language Processing (NLP) is one of the most important fields of study and researc ...

  5. 各种 AI 数据增强方法,都在这儿了

    来源 | 算法进阶 责编 | 寇雪芹 头图 | 下载于视觉中国 数据.算法.算力是人工智能发展的三要素.数据决定了Ai模型学习的上限,数据规模越大.质量越高,模型就能够拥有更好的泛化能力. 然而在实际 ...

  6. 盘点深度学习中的各种数据增强技巧

    1 什么是数据增强? 数据增强也叫数据扩增,意思是在不实质性的增加数据的情况下,让有限的数据产生等价于更多数据的价值. 比如上图,第1列是原图,后面3列是对第1列作一些随机的裁剪.旋转操作得来. 每张 ...

  7. 用于半监督语义分割的基于掩码的数据增强

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 小白导读 论文是学术研究的精华和未来发展的明灯.小白决心每天为大家 ...

  8. gan 总结 数据增强_白话GAN及其解决小样本问题的探讨

    作者:知乎-Curry 地址:https://www.zhihu.com/people/curry-5-28 一:白话GAN 本文尽量用少量的公式,浅显的语言来描述生成对抗网络,让未接触过GAN的人可 ...

  9. 只讲关键点之兼容100+种关键点检测数据增强方法

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 作者丨DefTruth 编辑丨极市平台 本文介绍了已有的几种关键点检测数据增强的方法,将其的优缺点进行 ...

  10. Mix3D:大规模三维场景的数据增强(3DV2021)

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 作者丨图灵智库 来源丨 泡泡机器人SLAM 标题: Mix3D: Out-of-Context Dat ...

最新文章

  1. python表示语句块采用_python中什么是语句块?
  2. android bitmap上传服务器,Android 上传图片到服务器时将bitmap转换为byte[]最后转换为String...
  3. JavaScript的10种跨域共享的方法
  4. Java基本语法(6)--算术运算符
  5. CSS 优化、提高性能的方法
  6. [Leedcode][JAVA][第466题][统计重复个数][数组]
  7. SpringCloud教程 | 第四篇:断路器(Hystrix)
  8. 琉璃男主成毅手机壁纸,你要么?
  9. 2021-2025年中国充气救生衣行业市场供需与战略研究报告
  10. liferay+portlet+开发实例
  11. BUCK降压电路和BOOST升压电路
  12. 2014年第五届蓝桥杯C++B组第四题:史丰收速算
  13. 嵌入式硬件常见英文总结
  14. 一个数如果恰好等于它的因子之和,这个数就称为“完数”。例如,6的因子为1,2,3,而6=1+2+3,因此6是“完数”。编程序找出1000之内的所有完数,并输出其因子。
  15. C盘扩容:如何把D盘内存扩展到c盘?
  16. 网络诊断提示:远程计算机或设备将不接受连接 (根治 )
  17. LNOI2022 退役记
  18. 人工智能与大数据的应用
  19. 关于js关闭窗口的事件和用法
  20. CDH大数据平台 Error while compiling statement: FAILED: SemanticException No valid privileges User tianlin

热门文章

  1. 中文大写日期转换函数
  2. directadmin php-fpm,centos7.5最新内核安装DirectAdmin面板
  3. 南方航空认沽权证21日上市 初始行权价为7.43元
  4. 华为me909s与MT2503拨号上网流程总结
  5. Notes V11内存不足?
  6. php生成word,并下载
  7. LaTeX数学公式大全
  8. 【Python程序设计】实验4:字符串与正则表达式
  9. 活化脂修饰NOTA,NOTA-NHS ester,CAS:1338231-09-6
  10. express静态文件