OCR识别之图像预处理

  • 图像预处理之作用及效果
  • 图像预处理之操作
  • 图像预处理之源代码

图像预处理之作用及效果

无论是使用图像来做识别还是别的操作,都需要对图像做一定的预处理操作,预处理的作用是方便后续我们对图像的识别,分类等操作。对于OCR识别来说要达到的效果如下图:
原始输入图像:

预处理之后的图像:

图像预处理之操作

以本实例的图像来说,首先需要找到内部白色纸片的边界,通过边界找到它的轮廓信息。根据其轮廓信息,应用Opencv中的轮廓近似得到大致的矩形区域,然后通过计算得到该矩形区域的宽高和四个顶点的坐标。然后将该矩形区域,直接通过变换转成(宽,高)的图像。

图像预处理之源代码

img_gray = cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)
img_gauss_blur = cv2.GaussianBlur(img_gray,(5,5),0)
img_canny = cv2.Canny(img_gray,34,158)
#以上代码,查找边界#根据查找到的边界信息,找到其轮廓信息
contours,h = cv2.findContours(img_canny,cv2.RETR_TREE,cv2.CHAIN_APPROX_NONE)#根据具体的实例,在众多轮廓中找到周长最大的前几个
length = []
for i,contour in enumerate(contours):length.append(cv2.arcLength(contour,True))
index = np.argmax(length)#对找到的周长最大的几个轮廓进行排序
def s(con):return cv2.arcLength(con,True)
cnts = sorted(contours,key = s,reverse=True)[:1]#找到轮廓近似
long = cv2.arcLength(cnts[0],True)
approx = cv2.approxPolyDP(cnts[0],0.1*long,True)res = cv2.drawContours(img.copy(),[approx],-1,(0,0,255),2)#通过近似轮廓找到四个顶点
tr = approx[0][0]
br = approx[1][0]
bl = approx[2][0]
tl = approx[3][0]#通过四个顶点计算相应的宽度和高度
widthr = int(np.sqrt((br[0]-tr[0])**2+(br[1]-tr[1])**2))
widthl = int(np.sqrt((bl[0]-tl[0])**2+(bl[1]-tl[1])**2))
width = np.max((widthr,widthl))heightb = int(np.sqrt((br[0]-bl[0])**2+(br[1]-bl[1])**2))
heightt = int(np.sqrt((tr[0]-tl[0])**2+(tr[1]-tl[1])**2))
height = np.max((heightb,heightt))#原始的矩形点,变换后的点
old_point = np.array([tl.tolist(),tr.tolist(),br.tolist(),bl.tolist()],np.float32)
new_point = np.array([[0,height-1],[0,0],[width-1,0],[width-1,height-1]],np.float32)#得到转换矩阵
M = cv2.getPerspectiveTransform(old_point,new_point)#得到转换后的图像
new_image = cv2.warpPerspective(img,M,(width-1,height-1))

OCR识别之图像预处理相关推荐

  1. 计算机表情识别技术研究学什么,表情识别的图像预处理和特征提取方法研究

    表情识别的图像预处理和特征提取方法研究 表情识别是基于视觉信息将脸部的运动或脸部特征的形变进行分类,包括三部分:脸部定位.脸部特征抽取和表情分类.本文首先使用肤色模型进行脸部定位;对提取出来的人脸进 ...

  2. Halcon图像预处理-图像的变换与校正

    提示:本文参考了网上其他相关文章,如有侵权,请联系作者. 文章目录 前言 一.图像处理与矩阵(Matrix).齐次坐标 1.图像的平移 2.图像的旋转 3.图像的缩放 4.补充 二.仿射变换 1.仿射 ...

  3. 如何利用图像预处理提高OCR的准确性?

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 OCR代表光学字符识别,将文档照片或场景照片转换为机器编码的文本. ...

  4. opencv ocr字符识别_OCR深度实践系列:图像预处理

    近一个半月时间没更了,在这段时间里针对OCR业务进行了深入研究,业务也已上线,谨以此篇作为OCR系列的开篇. 目前NLP+OCR的落地应用在市场上愈加火热,如金融领域的研报分析.司法领域的合同审核甚至 ...

  5. 一个基于OpenCV的Python程序,可以从摄像头捕获图像并识别简单数字。您可以根据需要进行调整,包括调整图像预处理和数字识别逻辑

    一个基于OpenCV的Python程序,可以从摄像头捕获图像并识别简单数字.您可以根据需要进行调整,包括调整图像预处理和数字识别逻辑 import cv2 import numpy as np imp ...

  6. 指针式仪表自动读数与识别(二):仪表图像预处理

    一.仪表图像预处理 1.预处理操作 在做任何图像处理相关操作之前都要先进行预处理.预处理操作包括: (1) 缩放和变换 缩放操作的主要目的是减小图像大小,减少计算量,缩放操作不是必须的,但是如果系统对 ...

  7. 人脸识别系统包括图像摄取、人脸定位、图像预处理、以及人脸识别

    https://www.toutiao.com/a6651763844760732164/ 2019-01-29 12:00:57 识别算法 一般来说,人脸识别系统包括图像摄取.人脸定位.图像预处理. ...

  8. 【数字图像处理】【Matlab】【汽车车牌识别】1-车牌图像预处理

    author:zox 实验环境:Matlab2019a 课程设计:汽车车牌识别 序号 内容 0 [任务+原理+设计方案] 1 车牌图像预处理 2 车牌定位 3 车牌字符分割 4+5 车牌字符识别+结果 ...

  9. Java使用OCR技术识别图形图像文本信息

    OCR技术 OCR技术是光学字符识别的缩写(Optical Character Recognition),利用文字识别技术将图像信息转化为文本信息.应用于银行票据.大量文字资料.档案卷宗.文案的录入和 ...

最新文章

  1. 水晶报表调用存储过程的问题
  2. checkbox点击切换选中状态
  3. Android拖拽详解
  4. jar包打补丁 jar -uf_windows下批处理指定不同jdk版本运行jar包
  5. 阿里云低延时直播RTS能力升级,让直播推流效果更佳
  6. 2017.10.13java上机出现中的问题
  7. 焊接符号标注图解示例_【干货】焊接图纸符号汇总 ,学习收藏!!
  8. 【poj3070】Fibonacci
  9. 上週末去南投玩了一下,順便拍了几张,拿出来和大家分享
  10. 关于playframework1.2.4 static 关键字使用的一些思考
  11. 推荐一种优秀的数据结构技巧
  12. edge里bing必应搜索不了解决办法
  13. lol服务器位置2017,LOL甜心宝贝的琴音和弦2017抽皮肤网页地址
  14. C语言 负数对正数取余,负数取余/整除,Python和C语言的不同
  15. 默认网关和静态路由表
  16. 全球喷气发动机收入预计2028年达到1189.6亿美元
  17. 巧妇居家过日子的妙招
  18. 小码笔记17:IO流
  19. 图形界面 I: 图形界面的动画 (第三章)
  20. idea 推送代码报‘error: The following untracked working tree ……’

热门文章

  1. 好文推荐 | 从数据的属性看数据资产
  2. 作者:武永卫(1974-),男,清华大学计算机科学与技术系教授
  3. 令人迷惑的硬币翻转(洛谷P1146题题解,Java语言描述)
  4. 【Java】BIO、NIO、AIO网络编程模型概述
  5. Hdu-6243 2017CCPC-Final A.Dogs and Cages 数学
  6. webpack 图片的路径与打包
  7. 玩转Redis集群(下)
  8. 【面试笔记系列】排序算法汇总
  9. 关于COCOS2D-X 中的音乐与音效应用的备注
  10. javascript技巧参考