电脑中有几百个PDF文件,文件内容格式一致,每个PDF文件第一页是一个表格。想把这几百个PDF文件里面的表格都提取出来,转为excel表,该怎么办?

打开ChatGPT(一定要用GPT4,编程能力很强。相比之下,gpt3.5弱太多了),输入提示词如下:

d盘有一个文件夹:guanlianjiaoyi,里面有很多pdf文件;你的任务是写一个Python程序,批量提取PDF文件中表格信息到excel文件,具体步骤:

1、打开一个PDF文件;

2、用pdfplumber提取第一页的表格信息;

3、以原有的PDF文件名作为excel表格文件标题,保存刚才提取的表格信息到excel文件,放到电脑d盘文件夹excel中

然后在命令行提示符里面安装pdfplumber:pip install pdfplumber

pdfplumber是一个Python库,用来读取和写入PDF文件。ChatGPT一会就生成了代码,复制到Visual Studio Code中,运行,很快就完成了。

打开其中的excel表检查看看,内容提取正确,完美!

零代码编程:用ChatGPT将PDF文件的表格批量转为Excel表格相关推荐

  1. Python编程--使用PyPDF解析PDF文件中的元数据

    Python编程–使用PyPDF解析PDF文件中的元数据 元数据 作为一种文件里非常明显可见的对象,元数据可以存在于文档.电子表格.图片.音频和视频文件中.创建这些文件的应用程序可能会把文档的作者.创 ...

  2. python怎么将txt转为excel_使用matlab或python将txt文件转为excel表格

    假设txt文件为: 一.matlab代码 data=importdata('data.txt'); xlswrite('data.xls',data); 二.python代码 利用pandas的Dat ...

  3. linux qt写入excel文件内容,Qt 读取Excel表格数据 生成Excel表格并写入数据

    Qt 读取Excel表格数据 生成Excel表格并写入数据 Qt 读取Excel表格数据 生成Excel表格并写入数据 修改.pro文件,增加 axcontainer QT += axcontaine ...

  4. 如何将PDF转换成可编辑的Excel表格?手机也可以操作。

    当我们在办公中碰到的都是数据表格的PDF文件时,想要提取表格中的内容,就得将PDF文件转变成可编辑的Excel表格,如何将PDF转换成Excel?今天和大家分享一种简单的方法,不需下载软件并且免费使用 ...

  5. 如何将文件夹中数据导入Excel表格

    如何将文件夹中数据导入Excel表格 将文件夹中的文件名整理到Excel中的简单办法: 把需要做在表格里的文件放到一个文件夹里,命名尽量简单(为了后面步骤中自己输入方便),如"123&quo ...

  6. Python3,5行代码,Chatxxx能对PDF文件进行旋转、提取、合并等一系列操作,看了这篇,80岁老奶奶走路都不扶墙了。

    ChatPDF的妙用 1.引言 2.代码实战 2.1 原理 2.2 安装 2.2 示例 2.2.1 创建PDF文件 2.2.2 旋转PDF文件 2.2.3 拆分PDF文件 2.2.4 合并PDF文件 ...

  7. java生成pdf文件流_java 已经获取pdf代码,如何把他pdf文件保存到本机 要求用输出流做...

    展开全部 一.iText介绍 iText是着名的开放源码的站点sourceforge一个项目,是用于生成PDF文档的32313133353236313431303231363533e4b893e5b1 ...

  8. Java生成条形码PDF文件【可批量】

    最近公司有个业务,需求是开发一个可以生成条形码PDF文档的小工具.另外,老板还要求能在五一前上线该工具,时间紧,任务重.正好最近ChatGPT正火爆,何不让他帮我实现这个工具呢? 二话不说,打开cha ...

  9. 办公室文员必备python神器,将PDF文件表格转换成excel表格!

    [阅读全文] 第三方库说明 # PDF读取第三方库 import pdfplumber# DataFrame 数据结果处理 import pandas as pd 初始化DataFrame数据对象 # ...

最新文章

  1. 产品经理岗位职责说明_技术负责人岗位职责,五大方面,超越岗位抓住未来才是技术大牛...
  2. 自学笔记——1.Pyhton保留关键字
  3. 阿里云服务器配置开发环境第一章:Centos7.3安装git 和 zsh
  4. 嵌入式小白到大神学习全攻略(学习路线+课程+学习书籍+练习项目)
  5. 3d布料系统横向飘动_重磅首发!ZB 2021自带布料运算,独家中文字幕!妈妈再不担心我通宵改衣褶了...
  6. 作家百态之一:作家、批评家与酒
  7. Druid的Segment Balance及其代价计算函数分析
  8. 佳能c3020维修模式 白电平调整_天禹/TY流量计指示针不动维修附近厂家
  9. getaway网关转发去前缀_蚂蚁金服 Service Mesh 大规模落地系列 - 网关篇
  10. 数字化营销的意义所在
  11. 西门子s7 计算机通讯,西门子S7-200使用Modbus协议(最全解析)
  12. Android隐藏app桌面图标
  13. django-上下文处理器
  14. Java实现背包问题之01背包(是否装满),完全背包
  15. linux安装系统前安装驱动(driver)方法
  16. freemarker之页面静态化
  17. 中学物理教学参考杂志社中学物理教学参考编辑部2022年第21期目录
  18. 字节跳动技术岗官方解析 · 客户端篇:业务、中台、infra,这里的客户端究竟是怎样的?...
  19. 你肯定不知道,一个历经了3万2千年的开源项目竟然是……
  20. 附上两张本人觉得不错的WIN7桌面壁纸

热门文章

  1. python wav文件与wave bytes的转化
  2. SQLserver 远程过程调用失败
  3. 耳朵财经要闻|民政部:利用区块链技术增强公益组织的透明度;香港区块链协会联合会长:区块链给企业带来新的沟通和融资模式...
  4. autojump使用举例
  5. 诺基亚5230_5235_RM-356刷机包20.6.006版
  6. Android音频管理:AudioFlinger分析
  7. 时间复杂度主定理分析及练习
  8. google首页被篡改
  9. 初学者需要注意的undefine和null的区别
  10. 使用Servlet和JSP开发Java应用程序 ---- 简单模拟天猫购物页面