对于模型训练的调优

注意梯度消失以及梯度爆炸

更换激活函数
ResNet block
batch normalization
梯度截断
预训练+微调

防止模型出现过拟合的情况

数据增强
提前停止
权重正则化
dropout

提前停止训练是一个非常有效的方法,同时能避免训练次数过多,浪费时间

通过学习率调度器进一步调优

恒定的学习率可能存在收敛慢、损失难以下降的问题,因此,我们可以动态地去调整学习率:

 创建优化器,并设置学习率(learning_rate)、动量(momentum)
optimizer = fluid.optimizer.Momentum(learning_rate=0.001,momentum=0.8)
optimizer = fluid.optimizer.AdamOptimizer(learning_rate=1e-6)
optimizer = fluid.optimizer.SGD(learning_rate=1e-5)

finetune时loss一直增大

原因:应该是学习率设的太大了,减少学习率并且加上warmup策略

OCR常见问题(4)相关推荐

  1. 深度学习之OCR相关经验记录

    写在前面:最近实习阶段做了一些关于OCR相关的内容,在此记录一下 Q1:基于深度学习的文字检测方法有哪几种?各有什么优缺点? A:常用的基于深度学习的文字检测方法一般可以分为基于回归的.基于分割的两大 ...

  2. OCR/STR生僻字数据训练 | PaddleOCR的Fine-tune常见问题汇总(3)

    1.印章如何识别? 使用带tps的识别网络或abcnet,2.使用极坐标变换将图片拉平之后使用crnn 2.多语言的字典里是混合了不同的语种,这个是有什么讲究吗?统一到一个字典里会对精度造成多大的损失 ...

  3. OCR训练常见问题(1)

    报错图片数量太少 Exception: The number of the whole data (800) is smaller than the batch_size * devices_num ...

  4. 离线 ocr 开源_在线和离线开始使用开源

    离线 ocr 开源 作为开源的初学者,您需要什么技能以及应该参加哪些项目 ? 这些是初学者使用开源软件,硬件,社区和方法的常见问题. 开源的新人们可以在线和离线开始他们的发现. 许多不同类型的事件和项 ...

  5. 搭建腾讯云通用文字识别General OCR项目及代码部署图文教程

    又双叒叕开始折腾新项目啦,今天研究什么呢?搭建一个图片文字识别,项目所需,都知道微信的扫一扫可以识别很多东西,之前搭建的扫码演示源代码直接拿过来使用识别,发现不行,,,只能扫码,其余的都不行,好吧,参 ...

  6. 网络爬虫和网络数据管理的常见问题集合

    网络爬虫从业者的一些常见问题: OCR 爬虫开发成本高不高? Selenium 会被直接检测出来吗? puppeteer-extra-plugin-stealth会被检测出来吗? 最高强度的爬虫对抗手 ...

  7. yorc.json_天若OCR文字识别工具 v5.0.0 开源轻量级最全桌面OCR软件

    天若OCR文字识别工具是一款轻量级最全桌面OCR软件,有些图片或视频中的信息想复制下来,这就要求我们要将这些图片或视频上的的信息截图后转换成可以编辑的文字,解决这个问题有些人知道用专业的OCR识别软件 ...

  8. ocr文字识别 php源码,OCR文字识别

    OCR文字识别 简介 HI,您好,欢迎使用学而思网校AI开放平台OCR文字识别接口服务. 本文档主要针对需要集成HTTP API的技术研发工程师,详细描述OCR文字识别能力相关的技术内容.您可以通过 ...

  9. 使用python在实现图片(包括扫描件的图片类pdf)转换成word文档过程中的常见问题

    pdf有两类,一类是别人用word转pdf,你想转过来那种,带有光标那种,计算机能轻松识别,转换相对简单很多.第二类,即图片类pdf,也就是平常工作中看到的各种扫描件,它的识别相对要复杂一些,但又常常 ...

最新文章

  1. PHP cron中的批处理(转)
  2. 微信基础服务肯定不收费
  3. 汽车开放系统架构(AUTOSAR)是什么
  4. android 连接mysql orm_Android ORM框架 GreenDao 的使用详解
  5. [转]Zend Studio 9正式版激活破解注册…
  6. html input submit 执行,HtmlInputSubmit 服务器控件声明性语法
  7. Teams Bot开发系列:Activity处理流程
  8. 【小白学云计算】xmpp开源服务器的配置和安装图文详解
  9. RxJava练武场之——Token前置请求
  10. mathtype 公式字体
  11. Java面试之爱立信
  12. 量子计算机采用量子力学原理,量子计算机的工作是不是就是根据量子力学原理造的?...
  13. 深度学习中的激活函数
  14. android OS 耗电量大,安卓os耗电高怎么解决
  15. 拼多多现重大Bug,一晚被薅羊毛数千万!
  16. 关于工作总结中的感悟
  17. 如何将图一-1变成图1-1(word题注的大写变成小写)
  18. 交换机不配access口能通吗_交换机的Access端口和Trunk端口
  19. 写一些生活的琐事(纯属发泄)
  20. 抖音小店无货源的回款周期是多久?怎么加快小店的回款周期?

热门文章

  1. python中key的意思_python中的key是什么意思
  2. python print(f)执行将报错_Linux中为什么执行自己的程序要在前面加./
  3. 【script】python通过字符串调用方法
  4. php 数组处理函数,PHP数组处理函数举例
  5. docker安装nextcloud(附nextcloud win7客户端下载教程)
  6. java 基础编程题 5
  7. 2运行内存多大_电脑有没有必要升到16GB内存?今年内存这么便宜?要不要抄底升级到16GB?...
  8. 页面滚动事件无效小记
  9. 正则表达式 RegularExpressions
  10. debian下tomcat8环境搭建