python屏幕文字识别_python识别图片文字

因为学校要求要刷一门叫《包装世界》的网课，而课程里有200多道选择题，而且只能在手机完成，网页版无法做题，而看视频是不可能看视频的，这辈子都不可能看...所以写了几行代码来进行百度搜答案。

思路如下：

手机屏幕投影到电脑上；

截图并识别图片文字；

调用百度来进行搜索；

提取html关键字。

环境配置：python3.6、第三方库：pyautogui、PIL、pytesseract、识别引擎tesseract-ocr

要识别中文，ocr引擎要下载一个中文包chi_sim放进Tesseract-OCR\tessdata里面。安装完ocr后还要配置一下调用路径，在Python36\Lib\site-packages\pytesseract找到pytesseract.py（这是我的windows路径），打开在里面添加一下路径：

1 # CHANGE THIS IF TESSERACT IS NOT IN YOUR PATH, OR IS NAMED DIFFERENTLY

2 tesseract_cmd = 'tesseract'

3 tesseract_cmd = 'C:/Program Files (x86)/Tesseract-OCR/tesseract.exe'

4 img_mode = 'RGB'

然后用AirDroid或者Vysor、360手机助手之类的将手机的屏幕投影到电脑上，用鼠标确定截图坐标，代码如下：

1 importpyautogui as pag

2 x,y =pag.position()

3 posStr = "position:"+str(x).rjust(4)+','+str(y).rjust(4)

4 print(posStr)

要获取两个坐标（截图开始坐标和结束坐标），然后利用获取的坐标运用如下代码截图并调用ocr引擎识别（识别出来的字是每个用空格分开的，所以要去除字符串中的空格），代码如下：

1 from PIL importImage2 from PIL importImageGrab3 importpytesseract4 importwebbrowser5

6 pos = (0,245,425, 327)7 cut_img =ImageGrab.grab(pos)8 cut_img.save('C:/imgSave/1.jpg') #保存截图到文件夹中

9 print("screenshots sucess")10

11 text=pytesseract.image_to_string(Image.open('C:/imgSave/1.jpg'),lang='chi_sim') #调用识别引擎识别

12 text=text.replace(" ","") #去空格13 print(text)14 url = 'http://www.baidu.com/s?wd=%s' % text #调用百度搜索

15 webbrowser.open(url)

最终因为搜出来的全是题库，所以就没有提取html关键字了，其实是懒。

python屏幕文字识别_python识别图片文字相关推荐

Java调用百度OCR文字识别API实现图片文字识别软件
java_baidu_ocr Java调用百度OCR文字识别API实现图片文字识别软件这是一款小巧方便,强大的文字识别软件,由Java编写,配上了窗口界面调用了百度ocr文字识别API 识别精度高 ...
java ocr api_Java调用百度OCR文字识别API实现图片文字识别软件
Java调用百度OCR文字识别API实现图片文字识别软件原创isinple 发布于2019-01-06 13:35:59 阅读数 1296 收藏展开 java_baidu_ocr Java调用百度 ...
图片文字提取，清华图片文字提取工具，wrod怎么提取图片文字，怎么把图片里面的文字提取?
在学习工作生活中,我们会遇到一些只能查看却无法下载的文档,如果想要使用里面的文本内容怎么办,我们只能一边看文档一边打字,但是这样的效率太低了.有没有其他的好的方式呢?比如将文档拍照或者干脆截图,再把图 ...
python 图片识别_python识别图片文字
滑稽研究所 python识别图片文字哈喽,大家好呀,我是滑稽君.大家在写论文时可能经常碰到无法复制文字的文章.明明找到了需要的内容却无法直接复制使用,这让我们十分苦恼.那么本期滑稽君就告诉大家如何使 ...
python处理pdf实例_Python程序图片和pdf上文字识别实例
实例一:先减少背景杂音,再做图片文字识别为了提高识别率,先用opencv-python对扫描的图片做预处理(减少背景杂音),然后调用pytesseract识别图片上的文字.处理方式就是: 学习Pyt ...
python 百度ocr安装_Python利用百度文字识别(OCR)服务实现图片文字提取，准确率超高...
最近和朋友聊天,聊到一个充满使命感但又略显心酸的话题--下班回家在网上给小朋友抄题...那么问题来了,除了大家所知的QQ文字识别功能之外,还有哪些方式可以做到文字识别呢. 作为一名热心的Python小 ...
（python）实现一个简单的图片文字识别脚本
文章目录截图文字识别## 访问剪切板总结快毕业了,除了准备答辩之外,就是看看书,各种瞎晃~ 那么,这两天在看书的时候遇到这么个问题: 首先,部分电子版的书籍是以扫描图片的形式展现的,在阅读过程 ...
【python 图片文字识别】pyocr图片文字识别
无意中发现了一个巨牛的人工智能教程,忍不住分享一下给大家.教程不仅是零基础,通俗易懂,而且非常风趣幽默,像看小说一样!觉得太牛了,所以分享给大家.点这里可以跳转到教程.人工智能教程 pyocr 官方网 ...
使用pytorch模型学习框架easyocr模块识别行程码图片文字并使用Flask Web返回指定信息json字符串
关注「WeiyiGeek」公众号设为「特别关注」每天带你玩转网络安全运维.应用开发.物联网IOT学习! 本章目录: 使用pytorch模型学习框架easyocr模块行识别程码图片安装部署实践使用 ...
如何调用百度文字识别API提取图片文字并保存-保姆级教程
百度API 百度API是百度提供的一套开放的应用程序接口,它允许开发者在百度的基础上构建应用程序,并通过百度的各种渠道进行推广和营销.百度API分为移动.Web.智能客服.数据.娱乐.传统IT六大类, ...

python屏幕文字识别_python识别图片文字

python屏幕文字识别_python识别图片文字相关推荐

最新文章

热门文章