动手学ocr·十讲--学习笔记一
动手学ocr·十讲 技术导论
课程链接请点击这里
1.1 OCR技术背景:
OCR是什么
OCR(Optical Character Recognition,光学字符识别)是计算机视觉重要方向之一。传统定义的OCR一般面向扫描文档类对象,现在我们常说的OCR一般指场景文字识别(Scene Text Recognition,STR),主要面向自然场景。
应用场景
一是车牌识别、银行卡信息识别、身份证信息识别、火车票信息识别、通用场景、工业场景、交通场景、医疗场景、教育场景、票据场景等面向垂类的结构化文本识别。
二是字幕自动翻译、内容安全监控等和其他技术结合完成多模态任务。
1.2 OCR技术挑战:
一是算法层
透视变换、尺度太小、文字弯曲、背景干扰、字体多变、多种语言、拍摄模糊、光照不足
二是应用层
1、海量数据要求OCR能够实时处理
2、端侧应用要求OCR模型足够轻量,识别速度足够快
1.3 OCR三种关键技术:
1、文本检测
2、文本识别
3、文档结构化识别
(其他OCR相关前沿技术,包括端到端文本识别、OCR中的图像预处理技术、OCR数据合成等)
1.4 产业实践难点:
1.5 产业级OCR开发套件PaddleOCR:
动手学ocr·十讲--学习笔记一相关推荐
- 视觉SLAM十四讲学习笔记-第六讲学习笔记总结(1)---非线性优化原理
第六讲学习笔记如下: 视觉SLAM十四讲学习笔记-第六讲-非线性优化的状态估计问题_goldqiu的博客-CSDN博客 视觉SLAM十四讲学习笔记-第六讲-非线性优化的非线性最小二乘问题_ ...
- 视觉SLAM十四讲学习笔记-第六讲-非线性优化的状态估计问题
专栏系列文章如下: 视觉SLAM十四讲学习笔记-第一讲_goldqiu的博客-CSDN博客 视觉SLAM十四讲学习笔记-第二讲-初识SLAM_goldqiu的博客-CSDN博客 视觉SLAM十四讲学习 ...
- 视觉SLAM十四讲学习笔记-第二讲-开发环境搭建
专栏系列文章如下: 视觉SLAM十四讲学习笔记-第一讲_goldqiu的博客-CSDN博客 视觉SLAM十四讲学习笔记-第二讲-初识SLAM_goldqiu的博客-CSDN博客 lin ...
- 视觉SLAM十四讲学习笔记-第七讲-视觉里程计-三角测量和实践
专栏汇总 视觉SLAM十四讲学习笔记-第一讲_goldqiu的博客-CSDN博客 视觉SLAM十四讲学习笔记-第二讲-初识SLAM_goldqiu的博客-CSDN博客 视觉SLAM十四讲学习笔记-第 ...
- 视觉SLAM十四讲学习笔记-第七讲-视觉里程计-对极几何和对极约束、本质矩阵、基础矩阵
专栏系列文章如下: 专栏汇总 视觉SLAM十四讲学习笔记-第一讲_goldqiu的博客-CSDN博客 视觉SLAM十四讲学习笔记-第二讲-初识SLAM_goldqiu的博客-CSDN博客 视觉SLA ...
- 视觉SLAM十四讲学习笔记-第四讲---第五讲学习笔记总结---李群和李代数、相机
第四讲---第五讲学习笔记如下: 视觉SLAM十四讲学习笔记-第四讲-李群与李代数基础和定义.指数和对数映射_goldqiu的博客-CSDN博客 视觉SLAM十四讲学习笔记-第四讲-李代数求导与扰动模 ...
- 视觉SLAM十四讲学习笔记---前三讲学习笔记总结之SLAM的作用、变换和位姿表示
经过半年学习SLAM相关知识,对SLAM系统有了一些新的认识,故回看以前的学习记录,做总结和校正. 前三讲学习笔记如下: 视觉SLAM十四讲学习笔记-第一讲_goldqiu的博客-CSDN博客 视觉S ...
- 视觉SLAM十四讲学习笔记-第七讲-视觉里程计-特征点法和特征提取和匹配实践
专栏系列文章如下: 视觉SLAM十四讲学习笔记-第一讲_goldqiu的博客-CSDN博客 视觉SLAM十四讲学习笔记-第二讲-初识SLAM_goldqiu的博客-CSDN博客 视觉SLAM十四讲学习 ...
- 视觉SLAM十四讲学习笔记-第六讲-非线性优化的实践-高斯牛顿法和曲线拟合
专栏系列文章如下: 视觉SLAM十四讲学习笔记-第一讲_goldqiu的博客-CSDN博客 视觉SLAM十四讲学习笔记-第二讲-初识SLAM_goldqiu的博客-CSDN博客 视觉SLAM十四讲学习 ...
最新文章
- 如何优雅的转换 Bean 对象!
- Java 性能调优的 11 个实用技巧
- 快上车!“正经”文章告诉你如何构建与使用分布式中间件平台实践
- #ifndef 与 #program once 的区别
- kafka源码分析之一server启动分析
- Vue.js 单元测试
- 第十节:实现vue组件之间的通信
- golang生成c-shared so供c语言或者golang调用到例子
- ftp4j的android应用
- 拓端tecdat|用R语言用Nelson Siegel和线性插值模型对债券价格和收益率建模
- idea svn回退版本_mac下使用svn通过终端回退版本到某个版本号 - 博客频道 - CSDN.NET...
- 基于springboot实验室管理系统
- 从新电脑开始构建FATE环境,图文并茂
- android 蓝牙打印兼容,在Android中使用蓝牙打印机打印不起作用
- 【娱见】乐视开始折腾路由器,小米与极路由还会好过吗?
- 2019考研 | 天津大学计算机专硕初试394分考研经历与经验总结(初试)
- fixable with the `--fix` option.
- 【注入】C# 构造注入的方法
- spark value $ is not a member of StringContext
- 罗塞塔总结_李晓瑞_廊坊师范提高班十五期_新浪博客
热门文章
- 自己的家用电脑怎么架设传奇私服??
- 电子科大2020计算机考研真题,2021电子科技大学考研历年真题复习资料
- 使用EChat通过php读取后台数据将其转换为饼状图
- WEB漏洞之:海洋CMS代码执行(CNVD-2020-22721)
- nowcoder17338 Interval Revisited
- python京东自动签到_python 使用selenium登陆京东签到哪京豆
- 使用曲面细分渲染毛发
- 3D打印开源软件Cura分析(1) 【转】
- android 装饰着模式,Android与设计模式——装饰者(Decorator)模式
- 智慧农业SaaS系统