文本分割之水平投影法基于OpenCV(python)版实现

对于如下一张图片，如何将文本区域分割成一行一行的了？

在文本分割领域中有一种很优秀的算法：投影法，包括水平投影法和垂直投影法。本文主要讲述水平投影法，水平投影法可以理解为一束光线从图像的左侧向右边进行照射，每一条光线可以理解为图像的一行，计算每一行上图像的黑色像素点，从而可以对图像进行分割。

import numpy as np
import cv2 def get_vvList(list_data):#取出list中像素存在的区间vv_list=list()v_list=list()for index,i in enumerate(list_data):if i>0:v_list.append(index)else:if v_list:vv_list.append(v_list)#list的clear与[]有区别v_list=[]return vv_listif __name__=='__main__':img_bgr=cv2.imread('./testImg/1.png',1)if not img_bgr is None:img=img_bgr.copy()img_gray=cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)#二值化t,binary=cv2.threshold(img_gray,0,255,cv2.THRESH_OTSU+cv2.THRESH_BINARY)'''水平投影从左向右投射，计算每一行的黑色像素总数'''rows,cols=binary.shapehor_list=[0]*rowsfor i in range(rows):for j in range(cols):#统计每一行的黑色像素总数if binary.item(i,j)==0:hor_list[i]=hor_list[i]+1'''对hor_list中的元素进行筛选，可以去除一些噪点'''hor_arr=np.array(hor_list)hor_arr[np.where(hor_arr<5)]=0hor_list=hor_arr.tolist()#绘制水平投影img_white=np.ones(shape=(rows,cols),dtype=np.uint8)*255for i in range(rows):pt1=(cols-1,i)pt2=(cols-1-hor_list[i],i)cv2.line(img_white,pt1,pt2,(0,),1)cv2.imshow('水平投影',img_white)cv2.waitKey(0)#取出各个文字区间vv_list=get_vvList(hor_list)for i in vv_list:img_hor=img_bgr[i[0]:i[-1],:,:]cv2.imshow('文本行',img_hor)cv2.waitKey(0)

运行上述代码，可以看到水平投影的效果。

根据投影法的特征，可以很容易就将上述文本分割成文本行，如下图所示：

文本分割之水平投影法基于OpenCV(python)版实现相关推荐

文本分割之垂直投影法基于OpenCV(python)的实现
在我的上一篇博客中讲述了水平投影法取出文本行图像的实现,在这里将用垂直投影法对文本行的每个字符进行分割.下图是用水平投影法切割的文本行: 文本分割的原理如下,先用水平投影取出单一文本行,接着使用垂直投 ...
基于 OpenCV + Python 的人脸识别上课签到系统
目录前言安装第三方库第一步:采集人脸图像 (1)修改姓名学号 (2)运行capture_face.py (3)采集人脸图像 (4)查看采集到的人脸图像第二步:训练模型第三步:识别签到 (1) ...
opencv java水平投影_使用OpenCv中Mat进行水平投影与垂直投影并实现字符切分
由于要做图像的处理,所以最近在学习Opencv的相关知识,学习了Opencv中的Mat对象,查阅了网上的资料,了解了相关知识.现在实现了一个使用Mat对象来进行图像的水平投影与垂直投影,并在此基础之上 ...
投影法字符分割matlab,利用投影法进行字符分割
1.概述字符分割有很多方法,但并不是每一种方法是万能的,那么就需要根据自己的需要来分析.例如:我现在项目的需求是将一串编号给切分开来.查了网上的资料和文献,大致适合项目的有两种方法:投影分割法和连通 ...
OpenCV2.4.13 文本分割（水平垂直，直方图投影）
进行文字分割时,有多种方法,对与不同情况可以分别处理. 问题1:如何进行文字分割? 答:对于文字是一般正规(不同行的文字一样高,每一行内部文字大致一样宽)的文本的情况. 这里给出了一种方法. 1)对图 ...
基于opencv+python实现数独
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录前言效果展示图一.引入库二.训练KNN模型三.读取数独图片并提取轮廓四.提取9*9的81小方格五.解析数独数字 ...
基于opencv+python的角度测量
import cv2 # 导入opencv import math # 导入math库,计算角度时需要path = './Angle Finder/background.png' # 测试样图相对路径 ...
基于Opencv+python的车流量检测项目
目录项目介绍整体流程调试环境项目流程 1.预处理 2.汽车识别--去背景算法(KNN/MOG2) 3.统计车流量数目结尾源代码测试视频资料流程图项目介绍本次项目主要采用了传统视觉的 ...
基于opencv+python的车道检测技术
针对自动驾驶系统的实际需求,我们需要一种能够兼顾速度.不同环境下高检测成功率和鲁棒性的车道识别算法.首先,因为停车场更多的是地下光线昏暗的情况需要提高车道线与周围环境的对比度,然后灰度化图像进行模糊降 ...

文本分割之水平投影法基于OpenCV(python)版实现

文本分割之水平投影法基于OpenCV(python)版实现相关推荐

最新文章

热门文章