现在免费的文字识别软件比较多,例如天若文字识别,QQ文字识别等,但是免费识别表格的软件却并不多。QQ文字识别可以识别出表格,但是效果不尽如人意。百度人工智能的文字识别模块每天有50000次的免费试用机会,据我的经验,识别效果也好于QQ,因此,申请一个百度人工智能接口,用python编个表格识别程序是不错的选择。以下例程中,为避免私密信息泄露,在程序同一目录下创建了一个baidu_keys.py文件,保存了我的百度人工智能客户端连接秘钥。

from aip import AipOcr  #导入AipOcr模块,用于做文字识别
import time #时间模块
import requests #用于下载识别结果
import io #用于创建写入剪贴板中的图像数据的字节数组
from PIL import ImageGrab #用于获取剪贴板上的图像数据
import keyboard #用于注册热键
import win32ui, win32con #用于弹出保存excel文件对话框
import sys
from baidu_keys import * #保存百度人工智能客户端注册信息# APP_ID = baidu_keys.APP_ID
# API_KEY = baidu_keys.API_KEY
# SECRET_KEY = baidu_keys.SECRET_KEY
client = AipOcr(APP_ID, API_KEY, SECRET_KEY)def table_ocr():print('开始识别...')image = ImageGrab.grabclipboard()if image != None:img_bytes = io.BytesIO()image.save(img_bytes, format='png')table = client.tableRecognitionAsync(img_bytes.getvalue())request_id = table['result'][0]['request_id']#判断识别是否完成,直到完成才根据请求ID获取Excel下载路径result = client.getTableRecognitionResult(request_id)  #通过ID获取识别结果while result['result']['ret_msg'] != '已完成': #如果状态是“已完成”,才能获取下载地址time.sleep(2) #暂停2秒再刷新result = client.getTableRecognitionResult(request_id) #持续刷新,直到满足条件download_path = result['result']['result_data']#下载Excel文件excel = requests.get(download_path) #指定识别结果保存位置及文件名win32ui.MessageBox('请指定识别文件保存位置及文件名...') flags = win32con.OFN_OVERWRITEPROMPTdlg = win32ui.CreateFileDialog(0, 'xls', '识别结果', flags, "Excel Files (*.xls)|*.xls;*.xlsx||", None) #0表示保存文件对话框;1表示打开文件对话框dlg.DoModal()file = dlg.GetPathName()#打开文件并写入内容with open(file, 'wb')  as excel_file:excel_file.write(excel.content) else:print('系统剪贴板中没有图形数据。')print('识别完成...')if __name__ == '__main__':print('截图复制到剪贴板后按shift+esc识别表格。\n按cmd+esc退出程序。')keyboard.add_hotkey('shift+esc', table_ocr)keyboard.wait('cmd+esc')sys.exit()

使用百度人工智能识别表格相关推荐

  1. c#调用百度API识别表格,提取返回的json结果

    需求: 最近要用c#写一个识别pdf扫描版里面表格,发现百度OCR识别表格还可以,下面介绍主要程序.(pdf扫描版我用python写的程序先改成png图片格式完整代码) 实现(代码我都自己运行了一遍, ...

  2. 百度OCR识别表格文字,并自动下载到本地(准确率很高)

    一.输入文件及申请的Token import java.io.BufferedReader; import java.io.IOException; import java.io.InputStrea ...

  3. Python百度ai识别图片表格

    Python百度ai识别表格 通过借助百度ai的接口实现含表格图片的识别,并将表格内容返回为Excel文件. 获取Access Token (1)有百度账号的直接登录百度ai,没有的注册在登录. (2 ...

  4. python调用百度AI识别文字和表格

    python调用百度AI识别文字和表格 获取账户信息 1.需要先注册百度AI,获得ID和密钥.百度AI社区关于注册的详细说明:https://ai.baidu.com/forum/topic/show ...

  5. Python编程:通过百度文字识别提取表格数据

    百度文字识别文档: https://ai.baidu.com/docs#/OCR-Python-SDK/top 安装sdk pip install baidu-aip 先创建应用,得到appid 要识 ...

  6. 人口普查分析:利用python+百度文字识别提取图片中的表格数据

    今天发布了最新的人口普查结果,笔者拿到的文件是pdf格式(网上应该有).之前就一直想实现从pdf提取表格数据,输出为excel.正好这次有公开数据,因此打算用来练个手. 尝试了两种方法: 1.pyth ...

  7. java+OpenCV3 +百度OCR(或tesseract) 识别表格数据

    原理:先用opencv识别出表格 按点拆分每个单元格图片 交给百度或tesseract识别 当然有钱的可以买百度的OCR表格识别.. package com.test; import java.io. ...

  8. 百度API批量识别表格与文字(记录)

    1.安装百度识别python包.pip install baidu-aip 2.申请ID.KEY等.打开百度,查看全部产品,找到AI. 注册.登录百度智能云. 找到文字识别,创建应用,申请到ID及两个 ...

  9. python人工智能文字识别软件_怎么用Python人工智能识别图片-百度AI文字识别使用方法分享 - Iefans...

    如果你是个Python初学者,那么你可以试着做做看这个教程,毕竟编程技能都是在实战中成长的,这篇教程是教你如何用Python来进行人工智能识别图片,可以帮助你解决日常办公时遇到的图片转换文字的问题. ...

最新文章

  1. Hadoop虚拟机的jdk版本和本地eclipse的版本不一致怎么办
  2. PIE SDK影像坏线修复
  3. Redis源码剖析(九)对象系统概述
  4. SAP UI5应用的一个调试参数 - sap-ds-debug=true
  5. Spring Security with Spring Boot 2.0:密码编码器
  6. linux入门系统那个好,初学Linux哪个发行版本好?这些更合适!
  7. ESP32 ESP-IDF开发环境搭建,Windows下基于ESP-IDF | Cmake | VScode插件的 ESP32 开发环境搭建
  8. 基于nodejs,tinypng的压缩图片工具
  9. 芯片技术---芯片到底是什么?
  10. 如何快速抠图?图片怎样去底色变透明?
  11. ps快捷键_学习笔记
  12. VMware导入vmdk格式的文件 踩了一堆坑~~~
  13. 电脑小知识:电脑怎么查看ip地址?
  14. 【一起入门DeepLearning】中科院深度学习第五课:正则化「Regularization」和优化「Optimization」
  15. 优先队列push pop操作
  16. 如何删除桌面的回收站图标
  17. RStudio介绍及入门
  18. rem与px之间的转换
  19. chroot的使用方法
  20. 未来计算机发展的三大趋势,报告:5G未来发展会有三大趋势 中国有望成为全球最大的AI市场...

热门文章

  1. [4G5G专题-93]:流程 - 4G LTE 终端在RRC 连接状态下的小区切换通用过程
  2. HTML5+CSS3小实例:酷炫的菱形加载动画
  3. 一文尽览 | 计算机视觉中的鱼眼相机模型及环视感知任务汇总!
  4. win10语言栏不见了_当我把电脑的系统语言改成了西班牙语,从此打开了新世界的大门!...
  5. 空间任一点到超平面的距离公式的推导过程
  6. 希腊字母的读法[转]
  7. Git入门之日志和版本回退
  8. codeforces #309 div2
  9. Java中多选题判断正确
  10. 【记第一次kaggle比赛】PetFinder.my - Pawpularity Contest 宠物预测