批量提取PDF和图片发票信息 2.2
人工录入发票信息真的好烦,有什么软件可以快速解决这个问题吗?
那天看到这个问题后,自己写了一个批量提取发票信息的小软件,打开软件之后,选择大量发票文件所在的文件夹就可以了,会自动把发票识别的结果输出为一个Excel 文件。应较多使用者的提议,第二版增加了更多发票的信息,比如销售方的名称,税率等等使用界面如下:得到的结果如下图:
优点:免费
不限制文件数量和大小,可以大批量操作
缺点:文件体积比较大
自己业余时间写的代码,测试不完善,很有可能有bug
图片发票暂时提取的信息还是比较有限,PDF格式的基本可以完全提取所有信息
2.2更新:
一个PDF文件里面多个发票的情况已经可以支持了
木马问题
上一版的软件因为木马问题和一个使用者留言争吵了起来,后来我自己也检测了,的确会报木马的问题,所以可能是误报,也可能的确是我的电脑存在问题,建议之前下载使用的朋友重新下载最新的,并且下载之后自己用杀毒软件检测一遍。建议之前下载使用的朋友重新下载最新的,并且下载之后自己用杀毒软件检测一遍。建议之前下载使用的朋友重新下载最新的,并且下载之后自己用杀毒软件检测一遍!!!
以后会吸取教训,发布之前都会使用360检测一遍。
软件打开出现闪退问题
是由于缺失了微软的VS组件的原因,安装以下程序,重启后即可解决该问题。
《微软常用运行库合集-2020.03.25-X64.exe》
图片格式和PDF格式
有使用者认为,既然图片识别的元素较少,PDF可以识别所有的元素,那我可以把图片都转成PDF不就可以了,其实是不行的,我所指的PDF是可以用鼠标复制里面的元素的PDF,如果里面还是图片,所能够识别的元素是和图片一样多的,比如扫描得到的PDF,它里面其实就是一个图片,不能用鼠标选中里面的元素,可以选中元素的PDF如下图所示:
主程序蓝奏云免登录直接下载地址:
https://wws.lanzoui.com/iep1apqj4hg
密码:1111
微软VS组件蓝奏云免登录下载地址(非必需,闪退才需要安装):
https://wws.lanzoui.com/iep2lp541oj
主程序百度网盘下载地址:
链接:https://pan.baidu.com/s/1b8l-0Q71biDYzD274VWFSw
提取码:1111
复制这段内容后打开百度网盘手机App,操作更方便哦
微软VS组件下载地址(非必需,闪退才需要安装):
链接:https://pan.baidu.com/s/1Ozgym2yNmI1sFVRl_QwGpw
提取码:1111
复制这段内容后打开百度网盘手机App,操作更方便哦
批量提取PDF和图片发票信息 2.2相关推荐
- 用 Python 批量提取 PDF 的图片,并存储到指定文件夹
今天给大家分享如何用 Python 批量提取 PDF 的图片,并存储到指定文件夹. 一.实现效果图 二.基于 fitz 库和正则搜索提取图片 fitz 库是 pymupdf 中的一个模块,用它来提取 ...
- 盘点一个批量提取pdf文件目标信息的实用案例
点击上方"Python爬虫与数据挖掘",进行关注 回复"书籍"即可获赠Python从入门到进阶共10本电子书 今 日 鸡 汤 你若盛开,清风自来. 大家好,我是 ...
- 如何用Python批量提取PDF文本内容?
本文为你展示,如何用Python把许多PDF文件的文本内容批量提取出来,并且整理存储到数据框中,以便于后续的数据分析. 问题 最近,读者们在后台的留言,愈发五花八门了. 写了几篇关于自然语言处理的文章 ...
- python怎么读取pdf为文本_轻松用Python批量提取PDF文本内容,这个小技巧告诉你!...
轻松用Python批量提取PDF文本内容,这个小技巧告诉你!-1.jpg (22.73 KB, 下载次数: 0) 2018-9-7 08:33 上传 本文为你展示,如何用Python把许多PDF文件的 ...
- python 如何批量提取文件中的字符_如何用Python批量提取PDF文本内容?
本文为你展示,如何用Python把许多PDF文件的文本内容批量提取出来,并且整理存储到数据框中,以便于后续的数据分析. 问题 最近,读者们在后台的留言,愈发五花八门了. 写了几篇关于自然语言处理的文章 ...
- python提取pdf文件内容_如何用Python批量提取PDF文本内容?
本文为你展示,如何用Python把许多PDF文件的文本内容批量提取出来,并且整理存储到数据框中,以便于后续的数据分析. 问题 最近,读者们在后台的留言,愈发五花八门了. 写了几篇关于自然语言处理的文章 ...
- Python3,9行批量提取PDF文件的指定内容,这种操作,保证人见人爱....
批量提取PDF文件指定内容 1.引言 2.代码实战 2.1 介绍 2.2 安装 2.3 实例 3.总结 1.引言 小屌丝:鱼哥, 你有没有什么办法,提取PDF文档的内容. 小鱼:这个还问我?? 小屌丝 ...
- 如何批量提取 PDF 文档内容,将 PDF 格式文档转为 Txt 文本格式
概要:PDF 文档常常用来阅读.预览或者存档一些资料,PDF 支持的内容也是比较丰富的.可以支持图片.文本等多种类型的元素.那有时候我们就需要将一些纯文本的 PDF 文档中的文字提取出来,转为一个 T ...
- python批量提取pdf的数据_Python批量提取PDF文件中文本的脚本
本文实例为大家分享了Python批量提取PDF文件中文本的具体代码,供大家参考,具体内容如下 首先需要执行命令pip install pdfminer3k来安装处理PDF文件的扩展库. import ...
最新文章
- MyISAM与InnoDB两者之间区别与选择,详细总结,性能对比
- 基于SIMD的AVS整数反变换算法设计与优化
- cef js返回c++的代码_CEF3开发者系列之外篇——IE中JS与C++交互
- 型人格 disc测试_什么是孤独型人格,如何测试筛查孤独型人格?
- CRF++总结 (1)(2)【转】
- RHEL 7.2 源码安装Python 3.6.2报错
- 【Android】 开发即时聊天工具 YQ (仿QQ) 教程:目录
- 国内最新Unity3D视频教程合辑
- python案例实操_Python 操作 Word 案例
- 360浏览器自动填充表单
- mac升级编译器gcc方法
- Pr动态图形模板Mogrt导入失败 Mogrt is Corrupt 解决方法 Motion Graphics Templates is corrupt.
- input tabIndex说明
- 查看期刊最近的影响因子
- LibGdx 安装使用
- 技术项目的评审及其标准
- Android版Google Maps入门:高级
- 蚁族程序员自述:冬天盼暖气,面朝西二旗
- html5中的空格怎么写,空格的代码(【html5空格代码怎么写】)
- 华为云HCIA鲲鹏结业考试笔记 试题及答案
热门文章
- python入门基础三之流程控制
- oneDNS解决google等登陆问题
- 中职计算机公开课说课稿,(完整)中职职高幼教专业手工实践《剪纸(雪花)》公开课说课稿...
- 【随记】无线网络能替代有线网络吗?
- 前端展示m3u8视频
- win101909要不要更新_win10游戏电脑要不要更新到1909版本?
- qt websocket android,QT使用websocket进行长连接
- 扬州大学计算机系导师,胡学龙
- Microdata Wordpress,WORDPRESS使用微数据
- qimgv(图片视频浏览器)-小工具