python屏幕文字识别_python识别图片文字
因为学校要求要刷一门叫《包装世界》的网课,而课程里有200多道选择题,而且只能在手机完成,网页版无法做题,而看视频是不可能看视频的,这辈子都不可能看...所以写了几行代码来进行百度搜答案。
思路如下:
手机屏幕投影到电脑上;
截图并识别图片文字;
调用百度来进行搜索;
提取html关键字。
环境配置:python3.6、第三方库:pyautogui、PIL、pytesseract、识别引擎tesseract-ocr
要识别中文,ocr引擎要下载一个中文包chi_sim放进Tesseract-OCR\tessdata里面。安装完ocr后还要配置一下调用路径,在Python36\Lib\site-packages\pytesseract找到pytesseract.py(这是我的windows路径),打开在里面添加一下路径:
1 # CHANGE THIS IF TESSERACT IS NOT IN YOUR PATH, OR IS NAMED DIFFERENTLY
2 tesseract_cmd = 'tesseract'
3 tesseract_cmd = 'C:/Program Files (x86)/Tesseract-OCR/tesseract.exe'
4 img_mode = 'RGB'
然后用AirDroid或者Vysor、360手机助手之类的将手机的屏幕投影到电脑上,用鼠标确定截图坐标,代码如下:
1 importpyautogui as pag
2 x,y =pag.position()
3 posStr = "position:"+str(x).rjust(4)+','+str(y).rjust(4)
4 print(posStr)
要获取两个坐标(截图开始坐标和结束坐标),然后利用获取的坐标运用如下代码截图并调用ocr引擎识别(识别出来的字是每个用空格分开的,所以要去除字符串中的空格),代码如下:
1 from PIL importImage2 from PIL importImageGrab3 importpytesseract4 importwebbrowser5
6 pos = (0,245,425, 327)7 cut_img =ImageGrab.grab(pos)8 cut_img.save('C:/imgSave/1.jpg') #保存截图到文件夹中
9 print("screenshots sucess")10
11 text=pytesseract.image_to_string(Image.open('C:/imgSave/1.jpg'),lang='chi_sim') #调用识别引擎识别
12 text=text.replace(" ","") #去空格13 print(text)14 url = 'http://www.baidu.com/s?wd=%s' % text #调用百度搜索
15 webbrowser.open(url)
最终因为搜出来的全是题库,所以就没有提取html关键字了,其实是懒。
python屏幕文字识别_python识别图片文字相关推荐
- Java调用百度OCR文字识别API实现图片文字识别软件
java_baidu_ocr Java调用百度OCR文字识别API实现图片文字识别软件 这是一款小巧方便,强大的文字识别软件,由Java编写,配上了窗口界面 调用了百度ocr文字识别API 识别精度高 ...
- java ocr api_Java调用百度OCR文字识别API实现图片文字识别软件
Java调用百度OCR文字识别API实现图片文字识别软件 原创isinple 发布于2019-01-06 13:35:59 阅读数 1296 收藏 展开 java_baidu_ocr Java调用百度 ...
- 图片文字提取,清华图片文字提取工具,wrod怎么提取图片文字,怎么把图片里面的文字提取?
在学习工作生活中,我们会遇到一些只能查看却无法下载的文档,如果想要使用里面的文本内容怎么办,我们只能一边看文档一边打字,但是这样的效率太低了.有没有其他的好的方式呢?比如将文档拍照或者干脆截图,再把图 ...
- python 图片识别_python识别图片文字
滑稽研究所 python识别图片文字 哈喽,大家好呀,我是滑稽君.大家在写论文时可能经常碰到无法复制文字的文章.明明找到了需要的内容却无法直接复制使用,这让我们十分苦恼.那么本期滑稽君就告诉大家如何使 ...
- python处理pdf实例_Python程序图片和pdf上文字识别实例
实例一:先减少背景杂音,再做图片文字识别 为了提高识别率,先用opencv-python对扫描的图片做预处理(减少背景杂音),然后调用pytesseract识别图片上的文字.处理方式就是: 学习Pyt ...
- python 百度ocr安装_Python利用百度文字识别(OCR)服务实现图片文字提取,准确率超高...
最近和朋友聊天,聊到一个充满使命感但又略显心酸的话题--下班回家在网上给小朋友抄题...那么问题来了,除了大家所知的QQ文字识别功能之外,还有哪些方式可以做到文字识别呢. 作为一名热心的Python小 ...
- (python)实现一个简单的图片文字识别脚本
文章目录 截图 文字识别## 访问剪切板 总结 快毕业了,除了准备答辩之外,就是看看书,各种瞎晃~ 那么,这两天在看书的时候遇到这么个问题: 首先,部分电子版的书籍是以扫描图片的形式展现的,在阅读过程 ...
- 【python 图片文字识别】pyocr图片文字识别
无意中发现了一个巨牛的人工智能教程,忍不住分享一下给大家.教程不仅是零基础,通俗易懂,而且非常风趣幽默,像看小说一样!觉得太牛了,所以分享给大家.点这里可以跳转到教程.人工智能教程 pyocr 官方网 ...
- 使用pytorch模型学习框架easyocr模块识别行程码图片文字并使用Flask Web返回指定信息json字符串
关注「WeiyiGeek」公众号 设为「特别关注」每天带你玩转网络安全运维.应用开发.物联网IOT学习! 本章目录: 使用pytorch模型学习框架easyocr模块行识别程码图片 安装部署 实践使用 ...
- 如何调用百度文字识别API提取图片文字并保存-保姆级教程
百度API 百度API是百度提供的一套开放的应用程序接口,它允许开发者在百度的基础上构建应用程序,并通过百度的各种渠道进行推广和营销.百度API分为移动.Web.智能客服.数据.娱乐.传统IT六大类, ...
最新文章
- 快速理解编码,unicode与utf-8
- 转:MFC 的程序中GetAt()的理解
- Redis 缓存实战——缓存、数据库一致性问题分析与解决方案
- vc可以实现对话框里显示html文档内容,也可以显示word内容吗,VC6中使用CHtmlView在对话框控制中显示HTML文档...
- T440安装Win7系统
- 光源时间_【精品透视】UVLED紫外固化光源崭露头角!
- win10怎么卸载Edge浏览器
- 修改Idea的jdk版本
- 二元隐函数求二阶偏导_隐函数求二阶偏导
- LDD3 sleepy 模块
- EOS代码架构及分析(四)
- 玩转WORD字体设置:WORD字间距怎么调整,WORD字体怎么调大等
- 算术右移与逻辑右移的区别
- 中医知识分享之《养生十八伤》
- wincc服务器不可用项目打不开,wincc客户端与服务器同步
- ios safari 描述文件 跳转到_iOS 超级签名之描述文件的实现过程
- C#数据库四种执行方法(ExecuteNonQuery)
- JAVA中JVM的重排序详细介绍(写得很明白)
- 劫持PR值的几个方法 假PR值成真PR值
- 【老生谈算法】MATLAB实现车间作业调度问题(JSP)遗传算法通用源码——JSP