python使用pytesseract识别图片中的文字
在python爬虫时,可能会遇到需要抓取验证码,识别图片中的文字等,python也确实提供了这个功能。下面便是步骤:
1. 下载Tesseract-OCR,下载地址为:tesseract下载地址,下载之后下一步下一步傻瓜式安装即可。随后将其添加到环境变量。在环境变量和系统变量的path中添加;D:\tesseract\Tesseract-OCR(tesseract的安装目录)。在cmd命令中执行tesseract -v,若出现以下页面,便是成功了。
2. 下载简体字识别包,地址为:tessdata,下载chi_sim.traineddata即可,如果需要识别其他字体,也可以下载相应字体。下载好的字体放入Tesseract-OCR\tessdata文件夹下。图为:
3. 在系统变量中新建一个配置信息,命名为:TESSDATA_PREFIX,变量值为安装路径D:Tesseract-OCR
4. 安装tesseract,cmd输入'pip install pytesseract'
5. 安装pillow, cmd输入'pip install Pillow'
6. 修改tesseract_cmd,打开D:\Python\Lib\site-packages\pytesseract中的pytesseract.py文件,ctrl+f搜索tesseract_cmd,将其改为简体中文包所在文件目录。'D:/tesseract/Tesseract-OCR/tesseract'。
7. 编写代码
好啦,就介绍到这里喽~
python使用pytesseract识别图片中的文字相关推荐
- ubuntu+python+百度AI识别图片中的文字
获取百度AI调用的 ID 和 key 打开百度AI官网:https://ai.baidu.com/ 点击控制台-登录账号-产品服务-图像识别-创建应用,勾选需要的服务(图像服务已默认全都选上, 此时我 ...
- 通过Python的pytesseract库识别图片中的文字
文章目录 前言 一.pytesseract 1.pytesseract是什么? 2.安装pytesseract 3.查看pytesseract版本 4.安装PIL 5.查看PIL版本 二.Tesser ...
- python识别图片上的文字_Python如何识别图片中的文字 【转】
Python如何识别图片中的文字,这里给个案例并附上详细步骤: 模块包的安装: 1.安装PIL:pip install Pillow 2.安装pytesser3:pip install pytesse ...
- 用 Python 识别图片中的文字
一.前言 不知道大家有没有遇到过这样的问题,就是在某个软件或者某个网页里面有一篇文章,你非常喜欢,但是不能复制.或者像百度文档一样,只能复制一部分,这个时候我们就会选择截图保存.但是当我们想用到里面的 ...
- python如何识别中文_python如何识别图片中的文字
python如何识别图片中的文字,这里给个案例并附上详细步骤: 模块包的安装: 1.安装PIL:pip install Pillow 2.安装pytesser3:pip install pytesse ...
- python 图片识别_Python—识别图片中的文字
一.前言 不知道大家有没有遇到过这样的问题,就是在某个软件或者某个网页里面有一篇文章,你非常喜欢,但是不能复制.或者像百度文档一样,只能复制一部分,这个时候我们就会选择截图保存.但是当我们想用到里面的 ...
- Python批量识别图片中的文字并保存到txt文档中
Python OCR工具pytesseract,之前是惠普的产品,被Google收了之后就给开源了. 1.需要下载并安装Google Tesseract,下载地址看图片上有,要下载4.0.0版本的 2 ...
- 如何用Python识别图片中的文字?
如何用Python识别图片中的文字? 转:https://mp.weixin.qq.com/s/wXDJoAAI8y1mtbUuwATngQ 以下文章来源于微信公众号:新建文件夹X ,作者ZackSo ...
- python识别汉字笔画_Python识别图片中的文字
Python识别图片中的文字 一.前言 不知道大家有没有遇到过这样的问题,就是在某个软件或者某个网页里面有一篇文章,你非常喜欢,但是不能复制.或者像百度文档一样,只能复制一部分,这个时候我们就会选择截 ...
- python批量识别图片中文字_Python识别图片中的文字
一.前言 不知道大家有没有遇到过这样的问题,就是在某个软件或者某个网页里面有一篇文章,你非常喜欢,但是不能复制.或者像百度文档一样,只能复制一部分,这个时候我们就会选择截图保存.但是当我们想用到里面的 ...
最新文章
- 【Qt】使用QPalette设置按钮颜色时,不生效
- Java 内部类及其原理
- editplus的配置和使用
- IBM在人工智能方面的新进展,理解谈话情景和感知情绪
- python mysql 分号_Python中使用MySQL
- spring中容器启动过程中初始化资源使用方法
- P1466 集合 Subset Sums 搜索+递推+背包三种做法
- halcon测试一张图片是否过曝或过暗
- 方程组的直接解法和迭代法 python_数据与算法总结——基本数值算法2(线性方程组)...
- 华为P40 Pro将搭载索尼IMX 700传感器:支持十六像素合一
- transformer中attention计算方式_Reformer: 局部敏感哈希、可逆残差和分块计算带来的高效...
- ios 添加导航栏视图_iOS进度栏(进度视图)
- 用LoadRunner实现接口测试
- H5 新特性之 fileReader 实现本地图片视频资源的预览
- layui 弹窗自适应高度_layui弹框自适应高度
- Rime中州韵导入QQ五笔词库
- mov和mp4格式哪个好_pr视频剪辑后导出文件格式那么多,你知道怎么选择吗?
- zsh历史记录文件损坏: zsh: corrupt history file /home/admin/.zsh_history
- 汇总:各类手游渠道特点及选择方法
- python2.7安装mysqldb_python2.7安装MySQLdb库