python批量图片文字识别_利用Python批量进行图片文字识别
实现逻辑
1. 批量获取图片的路径
2. 通过调用百度OCR接口批量识别图片
3. 将返回值写入txt
实现过程
1. 安装百度的Python SDK
pip install baidu-aip
2. 具体代码
from aip import AipOcr
import time
import os
#获取开始时间
start = time.time()
""" 你的 APPID AK SK """
APP_ID = '您的appid'
API_KEY = '您的AK'
SECRET_KEY = '您的SK'
client = AipOcr(APP_ID, API_KEY, SECRET_KEY)
""" 读取图片 """
def get_file_content(filePath):
print(filePath)
with open(filePath, 'rb') as fp:
return fp.read()
""" 写入文本 """
def write_on_txt(content,filePath,linefeed = "1"):
"""
content:要写入的内容
filePath:要写入文件的路径
linefeed :判断是否换行
- 1 为不换行
- 其他 为换行
"""
#只需要将之前的”w"改为“a"即可,代表追加内容
with open(filePath,"a") as file:
try:
file.write(content)
except:
print("写入错误")
else:
if linefeed != "1":
file.write("\n")
#图片路径
img_path = r"D:\图片" # 也可采用 r" D:\Test_path" 或者是"D:/Test_path"
#文本路径
txt_path = r"C:\Users\User29\Desktop\OCR\图片.txt"
options = {}
#遍历所有文件(使用 os.walk 方法)
for root,dirs,files in os.walk(img_path):
for file in files:
# 使用join函数将文件名称和文件所在根目录连接起来
file_dir = os.path.join(root, file)
print(file_dir)
write_on_txt("=============================",txt_path,"0")
write_on_txt("文件名:"+ file_dir,txt_path,"0")
#判断是否是图片
if file_dir[-4:]==".png"or file_dir[-4:]==".jpg":
#传入图片
image = get_file_content(file_dir)
""" 调用通用文字识别, 图片参数为本地图片 """
a = client.basicGeneral(image, options)
# 查看返回的结果
# print(a['words_result'])
print()
for dic in a['words_result']:
print(dic['words'])
write_on_txt(dic['words'],txt_path,"0")
end = time.time()
print('Running time: %1.2f Seconds'%(end-start))
python批量图片文字识别_利用Python批量进行图片文字识别相关推荐
- python图片文字合成视频_利用Python将多张图片合成视频的实现
今天要做一个量子隧穿的的演示动画,在CSDN上看了很多大佬的文章,然而忙了接近半天才做好这件事.把踩过的坑记一下,同时这段代码也是值得记录的,因为以后也可能遇到类似的工作. 先上代码` import ...
- python数字识别_利用Python进行数字识别
思路 通过Python实现KNN算法.而KNN算法就是K最近邻(k-Nearest Neighbor,KNN)分类算法,是一个理论上比较成熟的方法,也是最简单的机器学习算法之一.该方法的思路是:如果一 ...
- python 仪表数字识别_利用Python进行数字识别
思路 通过Python实现KNN算法.而KNN算法就是K最近邻(k-Nearest Neighbor,KNN)分类算法,是一个理论上比较成熟的方法,也是最简单的机器学习算法之一.该方法的思路是:如果一 ...
- python经纬度获取县名_利用 Python 批量获取县镇运输距离
起因 最近做规划项目,领导让查出某几个市的所有乡镇级行政区域,距离所在县级行政中心的交通运输距离.想着也不是啥难事儿,高德地图一搜就有. 当我把各市行政区划统计完,发现一共有五百多个乡镇,意味着要在地 ...
- python批量录入学生信息_利用Python实现学生信息管理系统的完整实例
项目要求: 读完题目,首先我们要确定程序思路 我们要全部通过类去实现 也就是 我们要实现管理员.学生.讲师.课程.教师五个类 管理员类 class Administration(object): de ...
- 利用python从网页查找数据_利用Python模拟淘宝的搜索过程并对数据进行可视化分析...
数据挖掘入门与实战 公众号: datadw 本文讲述如何利用Python模拟淘宝的搜索过程并对搜索结果进行初步的数据可视化分析. 搜索过程的模拟:淘宝的搜索页面有两种形式, 一种形式是, 2019/2 ...
- python制作心形照片墙_利用python生成照片墙的示例代码
PIL(Python Image Library)是python的第三方图像处理库,但是由于其强大的功能与众多的使用人数,几乎已经被认为是python官方图像处理库了.其官方主页为:PIL. PIL历 ...
- python用渐变色画圆_利用python控制Autocad:pyautocad方式
发现pyautocad模块:可以用python控制autocad的包.今天把文档中的重点内容摘录出来,以后绘图.计算大工程量.或者识别施工图的时候时候也许可以用到. 一.连接cad pyautocad ...
- python实现背景抠除_利用Python代码实现一键抠背景功能
这篇文章主要给大家介绍了关于如何利用Python代码实现一键抠背景的相关资料,文中通过示例代码介绍的非常详细,对大家学习或者使用Python具有一定的参考学习价值,需要的朋友们下面来一起学习学习吧 前 ...
- python怎么去掉视频字幕_利用Python实现字幕挂载(把字幕文件与视频合并)思路详解...
其实超简单超简单!python好现成的库,一下子省略了好多步骤! 本文在Windows环境下!linux只是不需要手动输入imagicmagick的位置! 需要用到的环境 python(基本上只要不是 ...
最新文章
- Ascend Pytorch算子功能验证
- 奇葩错误:“假缩进”(python专属)
- 01-CoreData 概述
- 用Scikit-learn和TensorFlow进行机器学习_1
- 关于IIS和Serv-U在同一台服务器中端口冲突问题
- weblogic10.3.6配置nodemanager
- 把接口作为函数的参数,那么任何实现了接口的类的实例都可以作为此函数的参数传递...
- 主站系统服务器选择,配电网自动化主站系统的结构_功能及操作系统的选择.doc...
- PostgreSQL的postmaser的fork的学习体会
- csdn的blog后台程序的导航菜单的实现
- php对smarty的使用,[ php ] php smarty使用!
- 《Android软件安全与逆向分析》— Android 书籍
- solaris服务器系统,服务器配置:快速安装solaris-10-x86操作系统
- pymc3学生成绩分析和预测(补充+翻译)
- 致所有仍然关注BreezeMaphack的朋友
- Java流程控制方法
- VS中SVN的简介、安装和使用(安装+汉化+使用)
- NoSQL数据库资料
- abc计算机发明英语翻译,英语四级翻译模拟练习:四大发明
- Xilinx 还是altera
热门文章
- java 模拟天眼查登陆,scrapy,我想模拟登陆天眼查网站,那个网站要滑动对齐验证,我能怎么办才能模拟登陆成功呢?...
- 做人要知足、做事要知不足、做学问要不知足
- 用Python从.srt或.vtt等格式的字幕文件中提取纯文字
- 2023年北京邮电大学计算机考研信息汇总
- java课程 数独 文库_一次数独生成及求解方案的剖析(Java实现)
- 水刺无纺布滤芯详细说明
- 心理测试详解:猴子小鸟蛇包
- vue中监听enter键触发事件
- 人工智能行业每日必读(01·15)
- 三个月速成Java--一些小建议和感概