python图片识别论文_Python识别文字,实现看图说话 | CSDN博文精选
原标题:Python识别文字,实现看图说话 | CSDN博文精选
作者 | 张小腿
来源 | CSDN博客
现在写文件很多网站都不让复制了,所以每次都是截图然后发到QQ上然后用手机QQ的文字识别再发回电脑。感觉有点小麻烦了,所以想自己写一个小软件方便方便自己,就有了这篇了:
首先语言是Python,要实现的功能主要为文字识别,所以需要调用OCR技术,要做到够方便,所以需要调用系统剪切板,还需要一个小窗口,使用的是pyqt5。
OCR是直接使用的Tesseract-OCR,具体使用可以去搜一下,网上有很多,这里给出下载地址:
Tesseract exe 下载地址:
https://digi.bib.uni-mannheim.de/tesseract/
训练data 下载地址:
https://github.com/tesseract-ocr/tessdata (chi_sim是简体中文)
识别方法为:
pytesseract.image_to_string(now_image, lang='chi_sim')
调用剪切板用的是:
clipboard = QApplication.clipboard
##取出剪切板的图片
clipboard.pixmap.save('cut_img.jpg')
##文字存入剪切板clipboard.setText(str)
整体代码很简单,我就不上了,附上软件地址:
64和32版本:
链接:
https://pan.baidu.com/s/129cgx5-hcLFiLhhaCIgHlQ&shfl=sharepset
提取码:2425
单32位版本(在64位系统下也能运行,记得添加信任):
链接:
https://pan.baidu.com/s/1JiRBXzG2glr445VoXI1BXA&shfl=sharepset
提取码:l08b
或者:
链接:https://download.csdn.net/download/qq_21189053/11878342
打包之后不知道为啥64位的200多M,32位只有30M。
由于调用了系统的剪切板,所以可能会被安全软件隔离,解压后添加信任区,并右键以管理员运行。
请放心使用,保证无毒!
附上使用截图:
解压后根据个人系统位数运行:
然后直接微信或QQ截图,可以将缩放比调大一点,准确一些:
然后不用保存,直接点击识别:
https://blog.csdn.net/qq_21189053/article/details/102624719
(*本文为 AI科技大本营转载文章, 转 载请 联系作者 )
扫码查看作者更多文章
▼▼▼
◆
责任编辑:
python图片识别论文_Python识别文字,实现看图说话 | CSDN博文精选相关推荐
- Python识别文字,实现看图说话 | CSDN博文精选
作者 | 张小腿 来源 | CSDN博客 现在写文件很多网站都不让复制了,所以每次都是截图然后发到QQ上然后用手机QQ的文字识别再发回电脑.感觉有点小麻烦了,所以想自己写一个小软件方便方便自己,就有了 ...
- 基于Python实现看图说话和微表情识别
1. 设计思想 对于人类来说,描述一张图片的内容是非常重要的.但因这个过程并没有标准答案,因此对于计算机来说这并不是一个简单地过程.我们希望通过本次实验能够设计一个模型完成让计算机给图片设定 capt ...
- 基于Python实现看图说话和微表情识别【100010260】
1. 设计思想 对于人类来说,描述一张图片的内容是非常重要的.但因这个过程并没有标准答案,因此对于计算机来说这并不是一个简单地过程.我们希望通过本次实验能够设计一个模型完成让计算机给图片设定 capt ...
- 利用MTCNN和FaceNet实现人脸检测和人脸识别 | CSDN博文精选
作者 | pan_jinquan 来源 | CSDN博文精选 (*点击阅读原文,查看作者更多文章) 人脸检测和人脸识别技术算是目前人工智能方面应用最成熟的技术了.本博客将利用MTCNN和FaceNet ...
- Neurons字幕组 | 2分钟带你看懂李飞飞论文:神经网络是怎样给一幅图增加文字描述,实现“看图说话”的?(附论文下载)
Neurons字幕组出品 翻译|智博校对|龙牧雪 时间轴|虫2后期| Halo 项目管理|大力 Neurons字幕组 第四期作品震撼来袭! Neurons字幕组源自英文单词Neuron,一个个独立的神 ...
- 人工智能导论—看图说话微表情识别
资源下载地址:https://download.csdn.net/download/sheziqiong/86178106 资源下载地址:https://download.csdn.net/downl ...
- 干货:NIST评测(SRE19)获胜团队声纹识别技术分析 | CSDN博文精选
作者 | xjdier 来源 | CSDN博文精选 (*点击阅读原文,查看作者更多精彩文章) 近日,NIST说话人识别技术评测 (Speaker Recognition Evaluation,SRE) ...
- 万字长文详解如何用Python玩转OpenGL | CSDN 博文精选
作者 | 天元浪子 来源 | CSDN博文精选 [编者按]OpenGL(开放式图形库),用于渲染 2D.3D 矢量图形的跨语言.跨平台的应用程序编程接口,C.C++.Python.Java等语言都能支 ...
- python 识别登陆验证码图片(完整代码)_python 识别登录验证码图片功能的实现代码(完整代码)...
在编写自动化测试用例的时候,每次登录都需要输入验证码,后来想把让python自己识别图片里的验证码,不需要自己手动登陆,所以查了一下识别功能怎么实现,做一下笔记. 首选导入一些用到的库,re.Imag ...
最新文章
- 大数据量下的集合过滤—Bloom Filter
- 《Groovy极简教程》第12章 Groovy的JSON包
- linux 6.8 安装教程,CentOS 6.8 7.2 安装图解详细教程
- python 功能化模块_【软件测试教程】Python模块化以及内置模块的使用
- SQL Server 2008存储结构之GAM、SGAM
- “内”忧“外”患,3 万台 Mac 有危险!
- 读取和写入文件的最简单方法
- 采用Mono进行移动开发图书推荐
- windows7下将mysql加入环境变量
- 疫情下企业面临的关键网络安全建设,去繁从简,保住核心安全
- linux 内核rps,Linux内核中RPS/RFS代码分析
- java.lang.UnsatisfiedLinkError: Couldn't load XXX
- 详谈外部H5页面跳转微信一键关注微信公众号的方案
- 学习计算机网络必看的书
- 【codeforces 794B】Cutting Carrot
- 成都Java培训机构太多,该怎样选择呢?
- “hulu客厅”开放,Spark培训计划报名啦
- C++学习力扣刷题错题本
- IBM X3850 X5 7143QEB 安装Proxmox 5 初始化ramdisk失败,服务器卡死问题处理方法
- (单纯性和L1 ball)投影梯度法
热门文章
- 理论+实验 详解MySQL高级SQL语句
- HTML大期末作业: 关于家乡介绍HTML网页设计——我的家乡鉴江(5页) HTML+CSS+JavaScript...
- 小猫爬山(排序、递归)
- Github fow Windows 安装问题
- 全国大学生数学建模竞赛 B题 RGV的动态调度策略
- JS 实现红包雨效果,倒计时开红包 兼容移动端
- Nature Microbiology综述:聚焦藻际--浮游植物和细菌互作的生态界面
- 复现论文DRL代码程序
- 16x16x16 4096个RGB LED的光立方是一种怎样的神奇效果,视频展示制作全过程
- siverlight网络分房间斗地主4出牌规则算法