因为学校要求要刷一门叫《包装世界》的网课,而课程里有200多道选择题,而且只能在手机完成,网页版无法做题,而看视频是不可能看视频的,这辈子都不可能看...所以写了几行代码来进行百度搜答案。

思路如下:

手机屏幕投影到电脑上;

截图并识别图片文字;

调用百度来进行搜索;

提取html关键字。

环境配置:python3.6、第三方库:pyautogui、PIL、pytesseract、识别引擎tesseract-ocr

要识别中文,ocr引擎要下载一个中文包chi_sim放进Tesseract-OCR\tessdata里面。安装完ocr后还要配置一下调用路径,在Python36\Lib\site-packages\pytesseract找到pytesseract.py(这是我的windows路径),打开在里面添加一下路径:

1 # CHANGE THIS IF TESSERACT IS NOT IN YOUR PATH, OR IS NAMED DIFFERENTLY

2 tesseract_cmd = 'tesseract'

3 tesseract_cmd = 'C:/Program Files (x86)/Tesseract-OCR/tesseract.exe'

4 img_mode = 'RGB'

然后用AirDroid或者Vysor、360手机助手之类的将手机的屏幕投影到电脑上,用鼠标确定截图坐标,代码如下:

1 importpyautogui as pag

2 x,y =pag.position()

3 posStr = "position:"+str(x).rjust(4)+','+str(y).rjust(4)

4 print(posStr)

要获取两个坐标(截图开始坐标和结束坐标),然后利用获取的坐标运用如下代码截图并调用ocr引擎识别(识别出来的字是每个用空格分开的,所以要去除字符串中的空格),代码如下:

1 from PIL importImage2 from PIL importImageGrab3 importpytesseract4 importwebbrowser5

6 pos = (0,245,425, 327)7 cut_img =ImageGrab.grab(pos)8 cut_img.save('C:/imgSave/1.jpg') #保存截图到文件夹中

9 print("screenshots sucess")10

11 text=pytesseract.image_to_string(Image.open('C:/imgSave/1.jpg'),lang='chi_sim') #调用识别引擎识别

12 text=text.replace(" ","") #去空格13 print(text)14 url = 'http://www.baidu.com/s?wd=%s' % text #调用百度搜索

15 webbrowser.open(url)

最终因为搜出来的全是题库,所以就没有提取html关键字了,其实是懒。

python屏幕文字识别_python识别图片文字相关推荐

  1. Java调用百度OCR文字识别API实现图片文字识别软件

    java_baidu_ocr Java调用百度OCR文字识别API实现图片文字识别软件 这是一款小巧方便,强大的文字识别软件,由Java编写,配上了窗口界面 调用了百度ocr文字识别API 识别精度高 ...

  2. java ocr api_Java调用百度OCR文字识别API实现图片文字识别软件

    Java调用百度OCR文字识别API实现图片文字识别软件 原创isinple 发布于2019-01-06 13:35:59 阅读数 1296 收藏 展开 java_baidu_ocr Java调用百度 ...

  3. 图片文字提取,清华图片文字提取工具,wrod怎么提取图片文字,怎么把图片里面的文字提取?

    在学习工作生活中,我们会遇到一些只能查看却无法下载的文档,如果想要使用里面的文本内容怎么办,我们只能一边看文档一边打字,但是这样的效率太低了.有没有其他的好的方式呢?比如将文档拍照或者干脆截图,再把图 ...

  4. python 图片识别_python识别图片文字

    滑稽研究所 python识别图片文字 哈喽,大家好呀,我是滑稽君.大家在写论文时可能经常碰到无法复制文字的文章.明明找到了需要的内容却无法直接复制使用,这让我们十分苦恼.那么本期滑稽君就告诉大家如何使 ...

  5. python处理pdf实例_Python程序图片和pdf上文字识别实例

    实例一:先减少背景杂音,再做图片文字识别 为了提高识别率,先用opencv-python对扫描的图片做预处理(减少背景杂音),然后调用pytesseract识别图片上的文字.处理方式就是: 学习Pyt ...

  6. python 百度ocr安装_Python利用百度文字识别(OCR)服务实现图片文字提取,准确率超高...

    最近和朋友聊天,聊到一个充满使命感但又略显心酸的话题--下班回家在网上给小朋友抄题...那么问题来了,除了大家所知的QQ文字识别功能之外,还有哪些方式可以做到文字识别呢. 作为一名热心的Python小 ...

  7. (python)实现一个简单的图片文字识别脚本

    文章目录 截图 文字识别## 访问剪切板 总结 快毕业了,除了准备答辩之外,就是看看书,各种瞎晃~ 那么,这两天在看书的时候遇到这么个问题: 首先,部分电子版的书籍是以扫描图片的形式展现的,在阅读过程 ...

  8. 【python 图片文字识别】pyocr图片文字识别

    无意中发现了一个巨牛的人工智能教程,忍不住分享一下给大家.教程不仅是零基础,通俗易懂,而且非常风趣幽默,像看小说一样!觉得太牛了,所以分享给大家.点这里可以跳转到教程.人工智能教程 pyocr 官方网 ...

  9. 使用pytorch模型学习框架easyocr模块识别行程码图片文字并使用Flask Web返回指定信息json字符串

    关注「WeiyiGeek」公众号 设为「特别关注」每天带你玩转网络安全运维.应用开发.物联网IOT学习! 本章目录: 使用pytorch模型学习框架easyocr模块行识别程码图片 安装部署 实践使用 ...

  10. 如何调用百度文字识别API提取图片文字并保存-保姆级教程

    百度API 百度API是百度提供的一套开放的应用程序接口,它允许开发者在百度的基础上构建应用程序,并通过百度的各种渠道进行推广和营销.百度API分为移动.Web.智能客服.数据.娱乐.传统IT六大类, ...

最新文章

  1. 快速理解编码,unicode与utf-8
  2. 转:MFC 的程序中GetAt()的理解
  3. Redis 缓存实战——缓存、数据库一致性问题分析与解决方案
  4. vc可以实现对话框里显示html文档内容,也可以显示word内容吗,VC6中使用CHtmlView在对话框控制中显示HTML文档...
  5. T440安装Win7系统
  6. 光源时间_【精品透视】UVLED紫外固化光源崭露头角!
  7. win10怎么卸载Edge浏览器
  8. 修改Idea的jdk版本
  9. 二元隐函数求二阶偏导_隐函数求二阶偏导
  10. LDD3 sleepy 模块
  11. EOS代码架构及分析(四)
  12. 玩转WORD字体设置:WORD字间距怎么调整,WORD字体怎么调大等
  13. 算术右移与逻辑右移的区别
  14. 中医知识分享之《养生十八伤》
  15. wincc服务器不可用项目打不开,wincc客户端与服务器同步
  16. ios safari 描述文件 跳转到_iOS 超级签名之描述文件的实现过程
  17. C#数据库四种执行方法(ExecuteNonQuery)
  18. JAVA中JVM的重排序详细介绍(写得很明白)
  19. 劫持PR值的几个方法 假PR值成真PR值
  20. 【老生谈算法】MATLAB实现车间作业调度问题(JSP)遗传算法通用源码——JSP

热门文章

  1. 科学软件编辑器在科研项目中的应用感想
  2. 主板检测卡c5_主板检测卡代码(常见)及解决方法
  3. 常用DOS命令参数的中文详解3
  4. Vue实现百度离线地图(v2.0)
  5. 计算机硬件兼容性,教你如何查看电脑硬件的兼容性
  6. ubuntu 安装 flash 软件 卸载
  7. windows xp 美化大师之系统主题
  8. 2018-03-28-日剂
  9. 论外挂入门(辅助入门)图色辅助与内存辅助的优与弊
  10. 药易通采购过账存储过程ts_c_BillAudit 分析