0.我的环境:

win7 32bits

python 3.5

pycharm 5.0

1.相关库

安装pillow:

pip install pillow

安装tesseract:

自带了英文语言包,如果需要中文语言包往下找即可。

或者在安装的时候,在选项lang处,点选chi-sim即可。

安装完毕后,会儿自动加入系统环境变量中。

安装pytesseract:

pip install pytesseract

2.修改pytesseract.py原文件

# tesseract_cmd = 'tesseract'

tesseract_cmd = 'C:/Program Files (x86)/Tesseract-OCR/tesseract.exe'

#如果不修改,会报错:FileNotFoundError: [WinError 2] 系统找不到指定的文件。

#f = open(output_file_name)

f = open(output_file_name, encoding='utf-8')

#如果不修改,会儿报错:UnicodeDecodeError: 'gbk' codec can't decode byte 0xyy in position xxx: illegal multibyte sequence

3.小程序,测试一下

#coding:utf-8

#Test one page

import pytesseract

from PIL import Image

def processImage():

image = Image.open('test.png')

#背景色处理,可有可无

image = image.point(lambda x: 0 if x < 143 else 255)

newFilePath = 'raw-test.png'

image.save(newFilePath)

content = pytesseract.image_to_string(Image.open(newFilePath), lang='eng')

#中文图片的话,是lang='chi_sim'

print(content)

processImage()

【图片识别】java 图片文字识别 ocr (转)

http://www.cnblogs.com/inkflower/p/6642264.html 最近在开发的时候需要识别图片中的一些文字,网上找了相关资料之后,发现google有一个离线的工具,以下为 ...

java 图片文字识别 ocr

最近在开发的时候需要识别图片中的一些文字,网上找了相关资料之后,发现google有一个离线的工具,以下为java使用的demo 在此之前,使用这个工具需要在本地安装OCR工具: 下面一个是一定要安装的 ...

Python图像处理之图片文字识别(OCR)

OCR与Tesseract介绍   将图片翻译成文字一般被称为光学文字识别(Optical Character Recognition,OCR).可以实现OCR 的底层库并不多,目前很多库都是使用共同 ...

如何大批量的识别图片上的文字,批量图片文字识别OCR软件系统

软件不需要安装,直接双击打开就可以用,废话不多说直接上图好了,方便说明问题 批量图片OCR(批量名片识别.批量照片识别等)识别,然后就下来研究了一下,下面是成果 使用步骤:打开单个图片识别,导入文件夹 ...

Python人工智能之图片识别,Python3一行代码实现图片文字识别

1.Python人工智能之图片识别,Python3一行代码实现图片文字识别 2.tesseract-ocr安装包和中文语言包 注意:

小试Office OneNote 2010的图片文字识别功能(OCR)

原文:小试Office OneNote 2010的图片文字识别功能(OCR) 自Office 2003以来,OneNote就成为了我电脑中必不可少的软件,它集各种创新功能于一身,可方便的记录下各种类型 ...

一篇文章搞定百度OCR图片文字识别API

一篇文章搞定百度OCR图片文字识别API https://www.jianshu.com/p/7905d3b12104

【原】Coursera—Andrew Ng机器学习—课程笔记 Lecture 18—Photo OCR 应用实例&colon;图片文字识别

Lecture 18—Photo OCR 应用实例:图片文字识别 18.1 问题描述和流程图 Problem Description and Pipeline 图像文字识别需要如下步骤: 1.文字侦测 ...

&lbrack;C13&rsqb; 应用实例:图片文字识别&lpar;Application Example&colon; Photo OCR&rpar;

应用实例:图片文字识别(Application Example: Photo OCR) 问题描述和流程图(Problem Description and Pipeline) 图像文字识别应用所作的事是 ...

随机推荐

css 强制 中文、英文 换行

.livechat-text a { display: block; word-break:break-all; /* 英文换行 */ white-space:normal; /* 中文换行 */ } ...

Hive集成HBase&semi;安装pig

Hive集成HBase 配置 将hive的lib/中的HBase.jar包用实际安装的Hbase的jar包替换掉 cd /opt/hive/lib/ ls hbase-0.94.2*  rm -rf ...

java - Stack栈和Heap堆的区别

首先分清楚Stack,Heap的中文翻译:Stack—栈,Heap—堆.         在中文里,Stack可以翻译为“堆栈”,所以我直接查找了计算机术语里面堆和栈开头的词语:        堆存储 ...

C&num;中方法的声明

C#中方法的声明(四要素) 访问修饰符 :public,private(方法的默认访问修饰符) 返回值类型:void 和 非void 方法名称    : 规范是方法名称取动词,每个单词的首字母大写. ...

Exception&amp&semi;Error

Java异常处理 1:什么是异常 异常(Exception)也叫异常.在Java编程语言中,异常就是程序在运行过程中由于硬件设备问题.软件设计错误.缺陷等导致的程序错误. 1.1:想打开的文件不存在 ...

一模 (6) day1

第一题: 题目大意: 一个n的全排列A[i]是单峰的,当且仅当存在某个x使得A[1]A[x+1]>...>A[n]. 试求 n 的单峰 ...

【转】 Java虚拟机内存的堆区(heap),栈区(stack)和静态区(static&sol;method)

JAVA的JVM的内存可分为3个区:堆(heap).栈(stack)和方法区(method) 堆区:1.存储的全部是对象,每个对象都包含一个与之对应的class的信息.(class的目的是得到操作指令 ...

sqlserver查询编辑器编辑数据

1.我想编辑这几行的sortid,方式可以直接写sql,但是还有一种更简洁的方法,如下: 2.用这种方式可以直接修改,比较方便. 3.总结:要做一件事情,可能有很多种方法.而且很有可能有简单的方法,如 ...

jquery fadeIn用法

$("#msgSpan").fadeIn("slow"); setTimeout('$("#msgSpan").hide("slo ...

flask中jinjia2模板使用详解2

接上文 注释的使用 在jinjia2模板中,使用{# #}进行代码注释,如下所示 运行后发现,注释不会被render出来 去掉空行 两种方法可以去掉jinjia2模板中的空白行,一是设置jinjia2 ...

python批量识别图片中文字_python实现中文图片文字识别--OCR about chinese text--tesseract...相关推荐

  1. python识别图片中数字_Python图像处理之图片验证码识别

    在上一篇博客Python图像处理之图片文字识别(OCR)中我们介绍了在Python中如何利用Tesseract软件来识别图片中的英文与中文,本文将具体介绍如何在Python中利用Tesseract软件 ...

  2. python切割图片文字_Python+opencv 实现图片文字的分割的方法示例

    Python+opencv 实现图片文字的分割的方法示例 发布时间:2020-08-26 03:28:37 来源:脚本之家 阅读:116 作者:坏小孩90 实现步骤: 1.通过水平投影对图形进行水平分 ...

  3. python 识别图片中的中文_Python中利用Tesseract软件来识别图片中的英文与中文

    OCR与Tesseract介绍 将图片翻译成文字一般被称为光学文字识别(Optical Character Recognition,OCR).可以实现OCR 的底层库并不多,目前很多库都是使用共同的几 ...

  4. python图片显示英文字符_Python中利用Tesseract软件来识别图片中的英文与中文

    OCR与Tesseract介绍 将图片翻译成文字一般被称为光学文字识别(Optical Character Recognition,OCR).可以实现OCR 的底层库并不多,目前很多库都是使用共同的几 ...

  5. python文字识别算法_Python图像处理之图片文字识别(OCR)

    OCR与Tesseract介绍 将图片翻译成文字一般被称为光学文字识别(Optical Character Recognition,OCR).可以实现OCR 的底层库并不多,目前很多库都是使用共同的几 ...

  6. python图像识别系统_Python图像处理之图片文字识别功能(OCR)

    OCR与Tesseract介绍 将图片翻译成文字一般被称为光学文字识别(Optical Character Recognition,OCR).可以实现OCR 的底层库并不多,目前很多库都是使用共同的几 ...

  7. python文字识别时、当文字不清晰时怎么处理_Python图像处理之图片文字识别功能(OCR)...

    OCR与Tesseract介绍 将图片翻译成文字一般被称为光学文字识别(Optical Character Recognition,OCR).可以实现OCR 的底层库并不多,目前很多库都是使用共同的几 ...

  8. python文本筛选多个word_用Python批量替换多个Word文件中的文字

    实例14:用Python批量替换多个Word文件中的文字 公众号"Python操作Office软件高效工作" 29 人赞同了该文章 我们在实例7中批量生成了采购合同.但是假设现在我 ...

  9. word批量替换多组文字 python_实例14:用Python批量替换多个Word文件中的文字

    我们在实例7中批量生成了采购合同.但是假设现在我方的公司名由"ABC商贸有限公司"变成了"ABC贸易有限公司",那我们就需要去每份合同中对应位置进行替换.当然也 ...

最新文章

  1. geyser学习记录(day2):我们在命令行当中怎么使用这个架构?
  2. 《转》cout和printf的混用而产生的顺序问题
  3. ASCII+Unicode+UTF8(字符编码方式-字节) Base64(字节编码方式-64字符)
  4. ubuntu16.04安装jekyll 3.3.1
  5. Java 反射 —— 运行时的类型信息
  6. 安卓短信功能全解:调用系统短信功能发送短信、彩信,使用SmsManager发送短信,并监听发送短信的投递情况,使用广播接收器监听接收的短信。
  7. 《大道至简》最后两章读后感
  8. Ubuntu下面安装MySQL shell
  9. MS17010原生打法
  10. # 关于Dran,Cran,CloundRan ,的区别
  11. 如何获取Windows 10的锁屏壁纸
  12. webERP 添加客户-amp;gt;分公司信息 'vtiger_accountid' doesn't have a default value
  13. XSS挑战之旅---游戏通关攻略
  14. ERP是什么?能做什么?
  15. win10如何给已分区的磁盘(如C盘)进行扩容?
  16. 不需代码 open pose多人动态人体骨骼识别,面部,手部,姿势识别
  17. 4位格雷码的顺序编码_格雷码编码规则_格雷码有什么规律
  18. 阿里巴巴暑期实习生笔试
  19. 【java毕业设计】基于java+原生Sevlet+socket的聊天室系统设计与实现(毕业论文+程序源码)——聊天室系统
  20. mysql 一个update语句 对主表内容和子表批量修改

热门文章

  1. node.js学习(1)
  2. 外贸企业收集了几十万的客户邮箱,怎么群发邮件?
  3. java 往数组里添加数据库_Java中将数组各元素作为数据项插入到数据库中
  4. bilibili自动答题
  5. 使用keras内置的模型进行图片预测
  6. 函授计算机在线考试答案,计算机应用基础函授本科考试题库完整
  7. 子网掩码必须是相邻的是什么意思_子网掩码必须是相邻的是什么意思 您输入一个无效的子网掩码...
  8. Redis深入——笔记三
  9. 弘辽科技:淘宝新手商家开店-必须绕过这几个坑!
  10. OSChina 周一乱弹 —— 你们谁看见了我的诺贝尔奖