机器视觉

从 Google 的无人驾驶汽车到可以识别假钞的自动售卖机,机器视觉一直都是一个应用广 泛且具有深远的影响和雄伟的愿景的领域。

我们将重点介绍机器视觉的一个分支:文字识别,介绍如何用一些 Python库来识别和使用在线图片中的文字。

我们可以很轻松的阅读图片里的文字,但是机器阅读这些图片就会非常困难,利用这种人类用户可以正常读取但是大多数机器人都没法读取的图片,验证码 (CAPTCHA)就出现了。验证码读取的难易程度也大不相同,有些验证码比其他的更加难读。

将图像翻译成文字一般被称为光学文字识别(Optical Character Recognition, OCR)。可以实现OCR的底层库并不多,目前很多库都是使用共同的几个底层 OCR 库,或者是在上面 进行定制。

ORC库概述

在读取和处理图像、图像相关的机器学习以及创建图像等任务中,Python 一直都是非常出色的语言。虽然有很多库可以进行图像处理,但在这里我们只重点介绍:Tesseract

Tesseract

Tesseract 是一个 OCR 库,目前由 Google 赞助(Google 也是一家以 OCR 和机器学习技术闻名于世的公司)。Tesseract 是目前公认最优秀、最精确的开源 OCR 系统。 除了极高的精确度,Tesseract 也具有很高的灵活性。它可以通过训练识别出任何字体,也可以识别出任何 Unicode 字符。

安装Tesseract

Windows 系统

下载可执行安装文件https://code.google.com/p/tesseract-ocr/downloads/list安装。

Linux 系统

可以通过 apt-get 安装: $sudo apt-get tesseract-ocr

Mac OS X系统

用 Homebrew(http://brew.sh/)等第三方库可以很方便地安装 brew install tesseract

要使用 Tesseract 的功能,比如后面的示例中训练程序识别字母,要先在系统中设置一 个新的环境变量 $TESSDATA_PREFIX,让 Tesseract 知道训练的数据文件存储在哪里,然后搞一份tessdata数据文件,放到Tesseract目录下。
  • 在大多数 Linux 系统和 Mac OS X 系统上,你可以这么设置: $export TESSDATA_PREFIX=/usr/local/share/Tesseract

  • 在 Windows 系统上也类似,你可以通过下面这行命令设置环境变量: #setx TESSDATA_PREFIX C:\Program Files\Tesseract OCR\Tesseract

安装pytesseract

Tesseract 是一个 Python 的命令行工具,不是通过 import 语句导入的库。安装之后,要用 tesseract 命令在 Python 的外面运行,但我们可以通过 pip 安装支持Python 版本的 Tesseract库:

pip install pytesseract

机器视觉与Tesseract介绍相关推荐

  1. Python:机器视觉与Tesseract介绍

    机器视觉 从 Google 的无人驾驶汽车到可以识别假钞的自动售卖机,机器视觉一直都是一个应用广 泛且具有深远的影响和雄伟的愿景的领域. 我们将重点介绍机器视觉的一个分支:文字识别,介绍如何用一些 P ...

  2. 机器视觉软件EVision介绍

    机器视觉软件EVision介绍 evision机器视觉软件包是由比利时euresys公司推出的一套机器视觉软件开发SDK,相比于其他的机器视觉开发包例如cognex vision library, M ...

  3. 第一章 工业机器视觉光源种类介绍

    系列文章目录 第一章 工业机器视觉光源种类.光源控制器介绍 目录 系列文章目录 前言 一.机器视觉--光介绍 1.生活中不同光的来源 2.机器视觉中光的颜色介绍 3.可见光的三原色 二.机器视觉--光 ...

  4. 图片识别工具Tesseract介绍和python搭配使用

    Tesseract介绍和Python的搭配使用 一.Tesseract介绍.下载指南 1.了解Tesseract工具 2.下载地址 3.请注意!!! 二 .环境搭建 2.1 版本3.05安装 2.2 ...

  5. 机器视觉和Tesseract

    机器视觉 从 Google 的无人驾驶汽车到可以识别假钞的自动售卖机,机器视觉一直都是一个应用广 泛且具有深远的影响和雄伟的愿景的领域. 我们将重点介绍机器视觉的一个分支:文字识别,介绍如何用一些 P ...

  6. Python爬虫开发【第1篇】【机器视觉及Tesseract】

    ORC库概述 在读取和处理图像.图像相关的机器学习以及创建图像等任务中,Python 一直都是非常出色的语言.虽然有很多库可以进行图像处理,但在这里我们只重点介绍:Tesseract 1.Tesser ...

  7. 机器视觉-相机镜头光源介绍及选型-12.系统选型

    系统选型 ===================================================================================== 1.选型步骤: 选 ...

  8. 机器视觉-相机镜头光源介绍及选型-3.光源分类

    光源分类 ===================================================================================== 1.1.颜色    ...

  9. 机器视觉-相机镜头光源介绍及选型-5.选择光源

    选择光源 ===================================================================================== 1.1.光源选择原 ...

最新文章

  1. MySQL优化篇:索引
  2. hibernateTemplate的load方法
  3. python调试神器_介绍一款调试Python的神器
  4. 多个数字数组_1分钟彻底理解JavaScript的数组与函数
  5. Hadoop实战项目之网站数据点击流分析(转载分析)
  6. 浏览器的重绘和重排的影响
  7. ORB-SLMA3的学习笔记
  8. haproxy5-ssl
  9. Android 四大组件学习之ContentProvider三
  10. .net MVC小尝试
  11. 日历java代码_java 日历代码实现
  12. python脚本微博自动转发抽奖_微博自动转发抽奖软件
  13. 安全红蓝对抗反制(反捕、画像)
  14. 让机器人飞入寻常百姓家,优必选这三步棋很关键
  15. 【Hgame2022】第一周misc和web题解
  16. 中文词性标注的简单实现
  17. 大数据创造大价值 我国大数据发展具有独特优势
  18. php微信卡券接口,核销卡券
  19. react中英文切换一
  20. 春雷计划:学Python竟然还有这种福利!

热门文章

  1. WinForm下屏幕截图程序的实现
  2. Android5.0L因SystemUI ANR导致的黑屏问题分析
  3. 基元线程同步构造之waithandle中 waitone使用
  4. Java环境变量CLASSPATH详解(转载)
  5. Microblogging Freedom
  6. 公共语言运行库中的程序集-04强命名的程序集
  7. 请wince驱动调试助手的作者sunrain_hjb以及wince开发者进来看看
  8. Linq杂谈之 — Linq导入Excel
  9. [ZT]比尔·盖茨被激怒 微软肩负起唱衰Google的使命
  10. TypeScript Never 与 Unknown