动手学ocr·十讲 技术导论

课程链接请点击这里

1.1 OCR技术背景:

OCR是什么
OCR(Optical Character Recognition,光学字符识别)是计算机视觉重要方向之一。传统定义的OCR一般面向扫描文档类对象,现在我们常说的OCR一般指场景文字识别(Scene Text Recognition,STR),主要面向自然场景。

应用场景
一是车牌识别、银行卡信息识别、身份证信息识别、火车票信息识别、通用场景、工业场景、交通场景、医疗场景、教育场景、票据场景等面向垂类的结构化文本识别。

二是字幕自动翻译、内容安全监控等和其他技术结合完成多模态任务。

1.2 OCR技术挑战:

一是算法层
透视变换、尺度太小、文字弯曲、背景干扰、字体多变、多种语言、拍摄模糊、光照不足

二是应用层
1、海量数据要求OCR能够实时处理
2、端侧应用要求OCR模型足够轻量,识别速度足够快

1.3 OCR三种关键技术:

1、文本检测
2、文本识别
3、文档结构化识别
(其他OCR相关前沿技术,包括端到端文本识别、OCR中的图像预处理技术、OCR数据合成等)

1.4 产业实践难点:

1.5 产业级OCR开发套件PaddleOCR:

动手学ocr·十讲--学习笔记一相关推荐

  1. 视觉SLAM十四讲学习笔记-第六讲学习笔记总结(1)---非线性优化原理

    第六讲学习笔记如下: 视觉SLAM十四讲学习笔记-第六讲-非线性优化的状态估计问题_goldqiu的博客-CSDN博客 ​​​​​​视觉SLAM十四讲学习笔记-第六讲-非线性优化的非线性最小二乘问题_ ...

  2. 视觉SLAM十四讲学习笔记-第六讲-非线性优化的状态估计问题

    专栏系列文章如下: 视觉SLAM十四讲学习笔记-第一讲_goldqiu的博客-CSDN博客 视觉SLAM十四讲学习笔记-第二讲-初识SLAM_goldqiu的博客-CSDN博客 视觉SLAM十四讲学习 ...

  3. 视觉SLAM十四讲学习笔记-第二讲-开发环境搭建

    专栏系列文章如下: 视觉SLAM十四讲学习笔记-第一讲_goldqiu的博客-CSDN博客 视觉SLAM十四讲学习笔记-第二讲-初识SLAM_goldqiu的博客-CSDN博客 ​​​​​​​ lin ...

  4. 视觉SLAM十四讲学习笔记-第七讲-视觉里程计-三角测量和实践

     专栏汇总 视觉SLAM十四讲学习笔记-第一讲_goldqiu的博客-CSDN博客 视觉SLAM十四讲学习笔记-第二讲-初识SLAM_goldqiu的博客-CSDN博客 视觉SLAM十四讲学习笔记-第 ...

  5. 视觉SLAM十四讲学习笔记-第七讲-视觉里程计-对极几何和对极约束、本质矩阵、基础矩阵

    专栏系列文章如下:  专栏汇总 视觉SLAM十四讲学习笔记-第一讲_goldqiu的博客-CSDN博客 视觉SLAM十四讲学习笔记-第二讲-初识SLAM_goldqiu的博客-CSDN博客 视觉SLA ...

  6. 视觉SLAM十四讲学习笔记-第四讲---第五讲学习笔记总结---李群和李代数、相机

    第四讲---第五讲学习笔记如下: 视觉SLAM十四讲学习笔记-第四讲-李群与李代数基础和定义.指数和对数映射_goldqiu的博客-CSDN博客 视觉SLAM十四讲学习笔记-第四讲-李代数求导与扰动模 ...

  7. 视觉SLAM十四讲学习笔记---前三讲学习笔记总结之SLAM的作用、变换和位姿表示

    经过半年学习SLAM相关知识,对SLAM系统有了一些新的认识,故回看以前的学习记录,做总结和校正. 前三讲学习笔记如下: 视觉SLAM十四讲学习笔记-第一讲_goldqiu的博客-CSDN博客 视觉S ...

  8. 视觉SLAM十四讲学习笔记-第七讲-视觉里程计-特征点法和特征提取和匹配实践

    专栏系列文章如下: 视觉SLAM十四讲学习笔记-第一讲_goldqiu的博客-CSDN博客 视觉SLAM十四讲学习笔记-第二讲-初识SLAM_goldqiu的博客-CSDN博客 视觉SLAM十四讲学习 ...

  9. 视觉SLAM十四讲学习笔记-第六讲-非线性优化的实践-高斯牛顿法和曲线拟合

    专栏系列文章如下: 视觉SLAM十四讲学习笔记-第一讲_goldqiu的博客-CSDN博客 视觉SLAM十四讲学习笔记-第二讲-初识SLAM_goldqiu的博客-CSDN博客 视觉SLAM十四讲学习 ...

最新文章

  1. 如何优雅的转换 Bean 对象!
  2. Java 性能调优的 11 个实用技巧
  3. 快上车!“正经”文章告诉你如何构建与使用分布式中间件平台实践
  4. #ifndef 与 #program once 的区别
  5. kafka源码分析之一server启动分析
  6. Vue.js 单元测试
  7. 第十节:实现vue组件之间的通信
  8. golang生成c-shared so供c语言或者golang调用到例子
  9. ftp4j的android应用
  10. 拓端tecdat|用R语言用Nelson Siegel和线性插值模型对债券价格和收益率建模
  11. idea svn回退版本_mac下使用svn通过终端回退版本到某个版本号 - 博客频道 - CSDN.NET...
  12. 基于springboot实验室管理系统
  13. 从新电脑开始构建FATE环境,图文并茂
  14. android 蓝牙打印兼容,在Android中使用蓝牙打印机打印不起作用
  15. 【娱见】乐视开始折腾路由器,小米与极路由还会好过吗?
  16. 2019考研 | 天津大学计算机专硕初试394分考研经历与经验总结(初试)
  17. fixable with the `--fix` option.
  18. 【注入】C# 构造注入的方法
  19. spark value $ is not a member of StringContext
  20. 罗塞塔总结_李晓瑞_廊坊师范提高班十五期_新浪博客

热门文章

  1. 自己的家用电脑怎么架设传奇私服??
  2. 电子科大2020计算机考研真题,2021电子科技大学考研历年真题复习资料
  3. 使用EChat通过php读取后台数据将其转换为饼状图
  4. WEB漏洞之:海洋CMS代码执行(CNVD-2020-22721)
  5. nowcoder17338 Interval Revisited
  6. python京东自动签到_python 使用selenium登陆京东签到哪京豆
  7. 使用曲面细分渲染毛发
  8. 3D打印开源软件Cura分析(1) 【转】
  9. android 装饰着模式,Android与设计模式——装饰者(Decorator)模式
  10. 智慧农业SaaS系统