ocr识别

一.什么是ocr

OCR英文全称是Optical Character Recognition,中文叫做光学字符识别。它是利用光学技术和计算机技术把印在或写在纸上的文字读取出来,并转换成一种计算机能够接受、人又可以理解的格式。现在这技术已经比较成熟。实际应用:比如一个手机APP就能帮忙扫描名片、身份证,并识别出里面的信息;汽车进入停车场、收费站都不需要人工登记了,都是用车牌识别技术;我们看书时看到不懂的题,拿个手机一扫,APP就能在网上帮你找到这题的答案。太多太多的应用了,OCR的应用在当今时代确实是百花齐放啊。

二.实现ocr识别

paddleocr的检测训练
paddleocr的识别训练

模型调用,实现ocr识别

from paddleocr import PaddleOCR, draw_ocr
# 模型路径下必须含有model和params文件
ocr = PaddleOCR(use_angle_cls=True,use_gpu=False)
# 参数设置,det_model_dir:检测模型路径,rec_model_dir:识别模型路径,cls_model_dir:方向模型路径,rec_char_dict_path文本字典
# det_model_dir='{your_det_model_dir}', rec_model_dir='{your_rec_model_dir}', rec_char_dict_path='{your_rec_char_dict_path}', cls_model_dir='{your_cls_model_dir}', use_angle_cls=True  img_path = '../ocr2.jpg'
result = ocr.ocr(img_path, cls=True)
for line in result:print(line)# 显示结果
from PIL import Image
image = Image.open(img_path).convert('RGB')
boxes = [line[0] for line in result]
txts = [line[1][0] for line in result]
scores = [line[1][1] for line in result]
im_show = draw_ocr(image, boxes, txts, scores, font_path='../PaddleOCR/doc/simfang.ttf')
im_show = Image.fromarray(im_show)
im_show.save('result.jpg') #结果图片保存在代码同级文件夹中。

场景应用

1.四类:
数字原生类:
淘宝商品图是最具有代表性的数字原生类文字图。
特点:1)最复杂多样:各种字体、背景、排列、组合等(MTWI挑战赛-最大的OCR竞赛)。
2)最有价值:商品信息载体
3)图片量最大:千亿图片,每日不停更新。

文档类:
文档类OCR需求非常广,涉及各种公务场景。
特点:1)100%识别率:人的输入准确率为98%,探索AI知识的极限;2)产品易用性:完善的功能,贴近业务需求;3)商业应用:文档类商业成熟。
拍照表单类:拍照表单类OCR价值非常大,非常有挑战性。
特点:1)场景&数据:数据具有隐私性,典型应用场景沉淀技术能力;2)产品通用性:专家知识+模板=文本理解,一套方案解决上百种类型。3)商业价值:和行业场景深度接入,AI能力改善行业数据流程。(提供定制的拍照表格识别和结构化云服务)
自然场景类: OCR学术研究的重点方向。
特点:1)数据:无具体数据类型定义,比如街拍数据;2)技术难点:不确定性,复杂环境干扰本质难点是定位和识别;3)商业价值:市场潜力巨大,如:车牌识别、摄像监控、自动驾驶。(技术能力领先,行业落地中)

发票的识别

一.确定发票的方向


电子发票、专用发票、普通发票,可以定位一个锚点,确定发票方向:
比如:机器编码(定位锚点),就可以确定-----正向的在左上角,-90°的在左下角,90°的在右上角,180°的在右下角,这样判断,就可以确定发票方向。
步骤:(也可以用YOLO等其余模型进行检测,比如:检测二维码的位置)
1.先进行ocr第一次识别(可能识别不到)
2.确定锚点位置信息
3.判断方向

二.识别信息截取

方法一:根据需要识别的信息,需要将识别信息一一对应,所以需要截取对应位置图片,进行识别
方法二:根据飞浆的最新的表格识别算法进行,定位识别飞浆表格识别

注:不同的发票,需要定位识别的位置也不同,需要不同的确定方式

三.结果

参考链接:
https://blog.csdn.net/wurmyq/article/details/90755568?ops_request_misc=&request_id=&biz_id=102&utm_term=ocr%E7%9A%84%E5%9C%BA%E6%99%AF%E5%BA%94%E7%94%A8&utm_medium=distribute.pc_search_result.none-task-blog-2allsobaiduweb~default-0-90755568.142v44pc_ran_alice&spm=1018.2226.3001.4187

ocr的场景应用--发票识别相关推荐

  1. 发票识别的全新自动化识别管理

    发票是整个财务系统中不可或缺的部分,也是让财务人员非常头疼的问题.而随着技术的更新发展,人工智能的概念,发票识别的出现,已经为公司的财务系统指明了道路,为财务人员节省了大量的时间和成本. 今天我们就讲 ...

  2. ocr 超时小票识别_票总管-发票识别核验利器

    发票在我们生活中扮演者十分重要的角色,发票是我们进行消费的凭证,也是我们进行报销的有力工具.然而随着生活水平的不断提升,发票种类的增多,给公司财务报销带来严重的负担.如何对公司发票有效分类则是另财务头 ...

  3. 发票识别/票据OCR识别浅析

    发票是整个财务系统中不可或缺的部分,也是让财务人员非常头疼的问题.而随着技术的更新发展,人工智能的概念,发票识别的出现,已经为公司的财务系统指明了道路,为财务人员节省了大量的时间和成本. 今天我们就讲 ...

  4. Uipath 百度OCR发票识别

    学习目标: 了解百度OCR 掌握Uipath 第三方API 请求HttpRequest 掌握Uipath 百度OCR 发票识别 如何将发票内容写入Excel 1.了解百度OCR 百度AI人工智能服务平 ...

  5. 对接百度OCR发票识别功能

    对接百度OCR 怎么对接百度OCR平台? 对接开放平台首先需要阅读api文档:->百度OCR-API文档地址, 按照文档操作看起来是不是特别的简单了,如果你需要在你的项目中使用的话你需要申请一个 ...

  6. OCR发票识别系统,轻松一键导出数据

    随着互联网财务管理的不断发展,财务管理作为任何企业的重要组成部分,直接关系到企业的管理效率与经济效益.对于大型企业集团来说,更是如此.科技的发展为我们创造了更多可能,OCR识别技术便是企业进行财务管理 ...

  7. 发票识别发票OCR解决方案

    越来越多的发票需要整理,越来越多的时间耗费在发票上,手动录入和人工检索,不仅浪费时间,而且容易出错.人工智能的时代已经来临了,越来越多的工作都会用人工智能的方式来解决,效率的提升不是一星半点.那么对于 ...

  8. 发票识别OCR及查验API接口为企业化解难题

    对于当今的现代企业来说,分散的财务管理模式效率不高,管理成本反而相对较高,制约了集团企业发展战略的实施,因而需要建设财务共享模式.一个企业要建成财务共享中心,面临的难题是大量的数据采集和信息处理工作, ...

  9. 【OCR】中文街景数据集、场景文本定位识别新网络:End2End-PSL

    #ICCV2019# 百度&香港大学提出新的中文街景数据集:C-SVT 和场景文本定位&识别新网络:End2End-PSL,表现 SOTA! #场景文本识别# 中国街景文本:大规模中文 ...

最新文章

  1. 使用KMeanCluster对多个区域进行聚类,并结合Matplotlib绘制中心点、最大最小距离点
  2. IBM X3550 RAID 扩容实例
  3. 从指定文件夹里COPY指定的一批文件列表(TXT文件)
  4. 成功人士不用睡觉吗?
  5. iphone全部机型_iPhone12卖爆 产业链喜迎5G时代 股价天花板打开?|iphone|iphone12|运营商|智能机...
  6. OpenCASCADE:OCCT应用框架OCAF之标准属性
  7. cacti linux cpu datasource,Cacti监控Cisco CPU 以及内存
  8. easyui 动态设置单元格控件_动态显示最大最小值的折线图
  9. 小米平板4android软件兼容吗,小米平板4有NFC功能吗 小米平板4支持NFC吗
  10. math python 向上取整_Python成为专业人士笔记-各数学运算操作深度剖析
  11. 评论后的Ajax和刷新分页,Wordpress Ajax 评论分页/翻页 – Fatesinger
  12. PHP实现电子商务网站
  13. Linux下查看网卡光衰值
  14. PCL_点云数据处理方法概述
  15. 回归预测 | MATLAB实现NCA(近邻成分分析)多输入单输出
  16. 【渝粤题库】陕西师范大学200461英语阅读(一) 作业(高起专、高起本)
  17. 《如何写好科研论文》
  18. redhat linux 禁用网卡,RedHat Linux下防火墙配置技巧
  19. 回收站清空的文件怎么恢复?失易得这样恢复
  20. HR让回去等通知,到底啥意思?

热门文章

  1. Unity 之 发布WebGL转微信小游戏过程详解
  2. CREO:CREO软件新建之草绘(.sec)、零件(.prt)、组件(.asm)、制造(.mfg)、绘图(.drw)、格式(.frm)、报表(.rep)、图表(.dgm)、布局简介、使用方法之详细攻略
  3. 可控核聚变与量子计算机哪个意意更大,实现可控核聚变有什么意义
  4. 《计算机网络》局域网
  5. html5+CSS+JavaScript学习笔记(小甲鱼)
  6. Go获取n天前或后的日期、日期转秒时间戳、计算两个日期之间的天数差
  7. 当初我要是这么学习「进程和线程」就好了(附带思维导图)
  8. C++矩阵的对角线之和
  9. win10电脑更新配置怎么关闭计算机,win10电脑提示更新并关机 win怎么关掉自动更新提示方法...
  10. OKEx调整上币规则,波多野结衣出席“AVH”发布会 | 区块链日报