最近有做财务的朋友提到,能否帮助他们做个工具,将每个月几百张的发票自动整理到EXCEL(既有PDF电子版、也有OFD的,甚至纸质的都还有,过程实在艰巨)。下来找了一圈有免费的、也有商用的,结果要么功能单一、要么缺少关键字段。对比实际效果以及后续的扩展性,决定还是先做个商用版的脚本试试,满足需求比什么都重要。关键是用Python来做,所有格式几步搞定,维护相对容易。

首先

准备好开发环境,商用的就比较简单了,直接下载安装就行(略);

下载地址:https://dgo.ink/crm/dl/?shareId=367561

参考手册:https://d.dgo.ink/doc/GoBot_Pro_1.0.pdf

开始设计

安装完成后,直接复制下面代码进去运行就可以,注意不要带入其他字符。剩下的可参考手册自行搞定。

import os,shutil
#设置发票根目录
path="d:/发票目录/"
scannedPath=path+'Scanned/'
if not os.path.exists(scannedPath):os.makedirs(scannedPath)
#设置Excel表头
data = [['原始凭证','发票号码','发票代码','购买方名称','合计金额','价税合计','销售方名称','纳税人识别号']]
for file in os.listdir(path):#只要这几种格式文件if file[-3:].lower() in ['jpg','png','pdf','ofd']:try:d = invoiceStr(path+file)#print(d)#查看解析出来的全部数据#按销售方+发票代码的规则重命名文件newName=d['SellerName']+d['InvoiceCode']+file[-4:]#添加和表头相对应的字段data.append([newName,d['InvoiceNum'],d['InvoiceCode'],d['PurchaserName'],d['TotalAmount'],d['AmountInFiguers'],d['SellerName'],d['SellerRegisterNum']])#移除已正常扫描的文件shutil.move(path+file,scannedPath+newName)print('凭证:%s,已识别完成!'%(file))except:pass
#保存全部数据到Excel文件
dumpData(data,name='增值税电子发票明细.xlsx',title='发票详情',path=path)

坐等结果

设计完成后,把各种格式的发票放在指定目录,然后运行上面的代码就可以了(完整的),字段是我调试用的,各位根据自己需求添加即可。

更新

根据实际需求增加了原始文件在识别后按规则自动重命名,同时Excel内也将使用新名称,方便日后归档处理,具体见代码第16行。示例命名规则为“销售方+发票代码”,仅供参考。

备注:

如果PDF电子发票是开票软件导出那种,是可以直接识别出来,但如果是普通的扫描件,需先转成图片才行。

批量识别PDF/OFD/PNG/JPG电子发票到EXCEL相关推荐

  1. 如何把ofd格式的电子发票批量自动生成excel台账

    随着国家税务局"全电票"政策的推进.大家在商务交易或报销环节收到越来越多的新版的OFD格式的发票.根据2020年<关于增值税发票综合服务平台的等事项的公告>国家税务总局 ...

  2. 沃通PDF签名证书 保障电子发票真实有效

    为什么80%的码农都做不了架构师?>>>    沃通CA与重庆有线网络股份有限公司达成合作,为重庆有线及其下属30余家分公司提供PDF签名证书产品,为电子发票业务提供可靠电子签名.​ ...

  3. 如何把pdf电子发票转为excel

    如何把pdf电子发票转为excel 越来越多的发票是电子发票版,发票的收集整理就是问题.如何能转为excel? 经过一番搜索找到一个靠谱工具.不但能把发票转为excel,还能把商品明细都提取出来. 下 ...

  4. OFD格式的电子发票文件怎么免费转换成PDF

    近年来OFD格式正在被越来越多的小伙伴所熟知,我们知道这是一种电子发票的格式,但是这种格式的文件需要特定的软件才能打开,为了方便阅览OFD文件中的内容,不少小伙伴想了很多办法,最终发现将OFD转为PD ...

  5. ofd转成html,第一次遇到ofd格式的电子发票,告诉你怎么转pdf

    我国近年来在全面实行专票电子化,国家税务总局还表示,未来电子发票将统一采用OFD格式.我前几天第一次遇到这个格式,我当时就挺慌的,因为接近年底了,需要跟客户对接账务问题.我发个OFD的电子发票过去,他 ...

  6. OFD格式的电子发票转PDF格式的方法

    安装增值税电子发票阅读器,点击打印,选择"microsoft print to pdf",默认是竖向打印,如何改成横向? 点击属性,选择"横向",缩放模式选择& ...

  7. Python识别二维码获取电子发票基本信息

    因工作需要,每月需要对大量的电子发票重命名,命名格式为发票代码_发票号码.pdf,几经尝试,发现同样是pdf格式的电子发票,使用pdfplumber读取出来的文字信息却有很大不同,一些通行费发票可以很 ...

  8. PDF批量识别OCR,Adobe acrobat pro批量识别pdf

    搜索了很久也没有找到批量识别海量pdf文件的方法,结果在adobe的官方找到了"动作" 这个功能. adobe acrobat pro是全世界最好的识别中文的软件,没有之一. 走的 ...

  9. [299]python实现批量解析PDF文件提取内容并写入到Excel中

    摘要:最近需要将一批PDF文件中的某些数据整理到Excel中,因为文件数量接近20w+,手动更新几乎不现实,于是就提取关键词和内容动手写了个Python小工具,以实现自动完成上述目标. 要求: 读取P ...

最新文章

  1. 测试机型不够?把玩家反馈过的问题机型,都测个遍
  2. eclipse调试一个struts2例子时遇到的一些问题总结
  3. koa --- [MVC实现之五]Model层的实现
  4. html期末网页设计,求网页设计的期末作业一份 HTML的
  5. postman测试带权限接口_接口测试工具:postman
  6. [JSOI 2015] 子集选取
  7. Hive分区和桶的概念
  8. 仿制波形驱动机器人- SAW
  9. Spring 集成 AspectJ的原理
  10. cidaemon.exe进程
  11. 概率统计Python计算:全概率公式
  12. VR基础——PicoVR SDK接入及使用整理
  13. Linux编码解码指令-base64
  14. echarts 堆叠柱状图label显示总和
  15. 软考备考-系统构架师-12-软件架构设计相关试题整理
  16. 。Windows 键盘快捷键
  17. MySQL、SQLServer 修改列名
  18. 【产品经理】需求调研--准备工作、目的分析、调研方式
  19. 在线拼接图片工具HTML源码
  20. 命令行批量删除文件夹中重复文件

热门文章

  1. 金仓数据库KingbaseES数据库参考手册(服务器配置参数14. 版本和平台兼容性)
  2. swift php 类型判断,Swift 5.1 新特性:透明类型关键字 some
  3. RK3399 GT1X触摸屏驱动调试笔记
  4. java外文资料_java外文文献(毕业设计).doc
  5. 世纪安图招募汉化志愿者
  6. GTK 框架(Frames)
  7. 计算机ms office二级试题,计算机二级MSoffice操作试题及答案
  8. Tiled map导入问题
  9. 字节辟谣被裁员工与 HR 互殴;苹果头显多个新功能曝光;谷歌希望 RISC-V 成为 T1 级 Android 架构|极客头条...
  10. JavaScript(第四天)—爱创课堂专业前端培训