今天我们来实现用Python来进行图片的文字提取。

技术原理:通过借助ORC和Tesseract工具来实现

文字识别是ORC的一部分内容,ORC的意思是光学字符识别,通俗讲就是文字识别。Tesseract是一个用于文字识别的工具,我们结合Python使用可以很快的实现文字识别。

实现过程第一步:先安装和配置Tesseract

并且要将Tesseract-OCR的安装目录配置到系统path变量当中,如下图所示,这样就完成了其配置。这里我的安装路径是C:\Program Files\Tesseract-OCR

第二步:接下来是下载两个需要的模块pytesseract和pillow

 对于一些图像的识别,我们需要使用pytesseract及相应的Tesseract引擎,它是开源的OCR引擎。pytesseract用于文字识别。Pillow在这里则是用于图片读取的

只要进入自己之前安装的虚拟环境,再输入pip install pytesseract 和pip install pillow即可。

有一点很重要就是需要将pytesseract.py中的tesseract_cmd改为安装的地址如下图

第三步:接下来我们就可以进行识别了。

输入代码如下:

英文识别:

先打开图片在进行识别

image_to_string:是指将图像上的Tesseract- OCR运行结果返回到字符串

原图如下:

运行结果:

识别数字:

原图如下:

运行结果:

但是现在还不能进行中文的识别,因为tesseract-ocr默认不支持中文识别,如果想要识别中文或者其它语言需要下载相应的语言包。

首先到网站 https://tesseract-ocr.github.io/tessdoc/Data-Files中下载中文包

下载完成后我们需要放到Tesseract的路径下的tessdata目录下,如图:

这样就可以进行中文的识别:

代码如下:

记得要将语言改成中文的:lang=chi_sim

原图如下:

运行结果:

目前这种OCR技术的应用领域主要分为八块:

①证件识别:主要识别证件信息,目前有证件采集仪、护照阅读器、门禁考勤机、人行通道闸机、人证一体扫描仪、移动端证件识别SDK等产品中应用该项技术

②银行卡识别:主要识别银行卡卡号,用于移动支付绑卡,提升APP用户体验。

③车牌识别:主要识别车牌号码、车牌颜色、车牌类型、车标、车身颜色等车辆特征信息,目前有PC端车牌识别SDK、移动端车牌识别SDK、车牌识别抓拍相机、DSP嵌入式车牌识别、车型识别、车位检测等产品应用了该项技术

④名片识别

⑤营业执照识别:主要识别营业执照信息(统一社会信用代码、公司名称、二维码等)

⑥汽车VIN码识别:主要识别车架号(汽车VIN码),用于汽车管理、汽车服务、二手车交易、租车等领域(互联网)

⑦票据类OCR识别

⑧文档文字OCR识别:主要识别文档文字,用于图书馆,报社等针对图书、报纸、杂志等文本类,需要把这些纸质文档进行电子化的领域

像我们生活中用的学习搜题软件(小猿搜题)都会用到文字识别的技术,通过拍照在进行文字提取,从而找到答案,如下图所示:


相关的视频在B站上,链接:图片识别_哔哩哔哩_bilibili

图片识别

Python之图片识别相关推荐

  1. python智能图片识别系统(图片切割、图片识别、区别标识)

    目录 技术介绍 运行效果 关键代码 写在最后 技术介绍 你好! python flask图片识别系统使用到的技术有:图片背景切割.图片格式转换(pdf转png).图片模板匹配.图片区别标识. 运行效果 ...

  2. Python实现图片识别加翻译,高薪必备技能

    Python使用百度AI接口实现图片识别加翻译 python python诞生30周年 encoding:utf-8 import requests import base64 from PIL im ...

  3. python简单图片识别_用Python进行简单的图片识别(1)

    起因是这样的,我想买一个定焦镜头,但也不是必需品,可以长期观望购买.最初的想法是,写个程序,每天爬一下各大电商网站的价格,或者直接爬etao把该镜头的价格记录下来,突然有一个惊爆的低价,就发邮件通知. ...

  4. Python实现图片识别加翻译

    Python使用百度AI接口实现图片识别加翻译 python诞生30周年 # encoding:utf-8import requests import base64 from PIL import I ...

  5. Python批量图片识别并翻译——我用python给女朋友翻译化妆品标签

    周末福利:文末赠书活动 最近小编遇到一个生存问题,女朋友让我给她翻译英文化妆品标签.美其名曰:"程序猿每天英语开发,英文一定很好吧,来帮我翻译翻译化妆品成分","来,帮我 ...

  6. python视频图片识别算法_python利用Opencv进行人脸识别(视频流+图片)

    首先:需要在在自己本地安装opencv具体步骤可以问度娘 如果从事于开发中的话建议用第三方的人脸识别(推荐阿里) 1.视频流中进行人脸识别 # -*- coding: utf-8 -*- import ...

  7. python相似图片识别_Python+Opencv识别两张相似图片

    Python+Opencv识别两张相似图片 在网上看到python做图像识别的相关文章后,真心感觉python的功能实在太强大,因此将这些文章总结一下,建立一下自己的知识体系. 当然了,图像识别这个话 ...

  8. python 百度识图_用python做图片识别(调用百度API)

    [Python] 纯文本查看 复制代码""" 读取图片 """ def get_file_content(filePath): with o ...

  9. Python Opencv 图片识别表格:边框线检测

    Python数据开发工作需求对图片做边框线检查和图片中的直线,非常实用建议收藏 文章目录 安装模块 1. 判断图片中是否有表格 2. 提取图片中的直线 千人全栈VIP答疑群联系博主帮忙解决报错 书籍推 ...

最新文章

  1. python -socket -client
  2. 怎么配置mysql的ip_设置MYSQL允许用IP访问
  3. C#和Sql Server 2005中时间的最大值和最小值
  4. jvm二:类加载,连接,初始化
  5. jsapi.php必须传openid,【微信统一支付】发起支付, returnCode != SUCCESS, returnMsg = JSAPI支付必须传openid...
  6. Nginx的root和alias指令
  7. CSS基础笔记(w3school)
  8. mysql中ibdata1过大的问题
  9. SourceInsight 常用快捷键
  10. jmeter 设置环境变量
  11. jQuery.获取子节点
  12. [C++]变量和基本类型
  13. Effective C++ 读书笔记之Part6.Inheritance and Object-Oriented Design
  14. python中使用frame需要安装_python – 在SFrame中分组而不安装graphlab
  15. 3DMAX 卸载方法,完美彻底卸载清除干净3DMAX各种残留注册表和文件【转载】
  16. bug严重等级与优先级
  17. 使用 ffmpeg批量给图片加水印
  18. thinkphp5.1 + 汉字转拼音 + 获取拼音首字母
  19. 于数学极限定义的量词组合复杂度
  20. 服务器芯片组 c242评测,完胜690!最详尽的C68G芯片组性能评测

热门文章

  1. 14种机器学习常见算法分类汇总
  2. 把病毒写到区块链上可以永远不死? 我们做了一个大胆的实验…… | 技术头条...
  3. aardio基础实例——一个简单的计算器
  4. 十二省联考 2019 题解
  5. 唯一邀请码生成(Java版本)
  6. 为了帮女神完成钢琴家梦想,我用Python写了一个自动弹钢琴脚本,轻松弹奏出各种钢琴曲!
  7. windos10+ubuntu16.4安装历程(超级详细,解决识别不出未分配空间等问题)
  8. 2018年Android面经-BAT、头条、网易、爱奇艺、华为等等(中)
  9. 卡莱特递交注册:年营收5.8亿 周锦志控制63%股权
  10. 电脑计算机无法启动有还原和取消,电脑启动修复无法取消 怎么处理