Python合成PDF文件

最近有一个需求,就是把多个pdf按照xls文件里的规则合并成一个pdf,在网上找了下,没有发现现成的东西,只有自己动手了。

图片

简单来说就是把文件1.pdf,文件2.pdf,文件3.pdf,合并成《合并文件1》,

把文件11.pdf,文件22.pdf,文件33.pdf,合并成《合并文件2》。

理解需求了,就开始写代码了。


首先要读取xls文件就要一个库,openpyxl(pands也可以),这里以openpyxl为例。
加载要使用openpyxl中的具体库:

from openpyxl import load_workbook

加载后开始加载文件

wb = load_workbook('data/source_data.xlsx') #加载具体xlsx文件
sheet1 = wb['source_data']  #加载具体的sheet


接下来就是循环xlsx文件里的内容,开始合成文件了。

for i in range(1, sheet1.max_row):mergePdfName = sheet1.cell(row=i + 1, column=1).valueif mergePdfName is None:print('没有填写待合成的文件名,跳过本次执行')continue# 添加封面文件名字data.append('fm_' + mergePdfName + '.pdf')mergePdfName = mergePdfName + '.pdf'print('开始合成' + mergePdfName)data1.append(mergePdfName)for j in range(1, sheet1.max_column):fileName = sheet1.cell(row=i + 1, column=j + 1).valueif fileName is not None:data.append(fileName)if data:mergepdf(data, "water_" + mergePdfName)data = []

合成方法:
这里用的是pypdf2库

from PyPDF2 import PdfFileReader, PdfFileWriter
def mergepdf(infilelist, outfile):pdfFileWriter = PdfFileWriter()for inFile in infilelist:fileName = 'data/' + inFileif os.path.exists(fileName):pdfReader = PdfFileReader(open(fileName, 'rb'))numPages = pdfReader.getNumPages()for i in range(0, numPages):pageObj = pdfReader.getPage(i)pdfFileWriter.addPage(pageObj)pdfFileWriter.write(open('output/' + outfile, 'wb')) #合成后放在output文件夹下

ok,代码结束了。是不是很简单?
其实还有很多功能可以完成,比如加水印,插入pdf页面内容,文件加密等。
不懂的可以留言。或者关注v 七月之上7,后台留言哦。

Python合成PDF文件相关推荐

  1. Python绘制PDF文件~超简单的小程序

    Python绘制PDF文件 项目简介 这次项目很简单,本次项目课,代码不超过40行,主要是使用 urllib和reportlab模块,来生成一个pdf文件. reportlab官方文档 http:// ...

  2. gnuradio上怎么使用python文件_使用Python从PDF文件中提取数据

    前言 数据是数据科学中任何分析的关键,大多数分析中最常用的数据集类型是存储在逗号分隔值(csv)表中的干净数据.然而,由于可移植文档格式(pdf)文件是最常用的文件格式之一,因此每个数据科学家都应该了 ...

  3. pdf exe如何提取pdf文件_python应用:如何用python提取pdf文件中的文字

    从pdf中提取文字,相信很多人都干过这事,怎么在python中实现呢,今天带大家看看. 第一步导入库 import PyPDF2 第二步导入pdf文件 pdf_file =open('dataset/ ...

  4. python数据生成pdf,Python生成pdf文件的方法

    摘要:这篇Python开发技术栏目下的"Python生成pdf文件的方法",介绍的技术点是"python生成pdf文件.python生成pdf.生成pdf文件.Pytho ...

  5. 使用Python从PDF文件中提取数据

    前言 数据是数据科学中任何分析的关键,大多数分析中最常用的数据集类型是存储在逗号分隔值(csv)表中的干净数据.然而,由于可移植文档格式(pdf)文件是最常用的文件格式之一,因此每个数据科学家都应该了 ...

  6. Python:PDF文件转图像

    Python:PDF文件转图像 什么是PyMuPDF? Python环境下想要将PDF文件转图像,可以使用PyMuPDF库. PyMuPDF是MuPDF的Python绑定-"轻量级PDF和X ...

  7. 利用Python提取PDF文件中的文本信息

    如何利用Python提取PDF文件中的文本信息 日常工作中我们经常会用到pdf格式的文件,大多数情况下是浏览或者编辑pdf信息,但有时候需要提取pdf中的文本,如果是单个文件的话还可以通过复制粘贴来直 ...

  8. 如何用python修改pdf内容_如何利用python将pdf文件转化为txt文件?

    https://www.wukong.com/answer/6579491774144708872/?iid=15906422033&app=news_article&share_an ...

  9. 使用Python读取pdf文件

    学习python,不用再为pdf无法转换而烦恼~~~ 下面我们介绍python读取pdf文件(主要是针对文字部分) 1.打开环境 2.安装pdfminer3k包 可以使用jupyter noteboo ...

  10. python读取pdf文件_深入学习python解析并读取PDF文件内容的方法

    这篇文章主要学习了python解析并读取PDF文件内容的方法,包括对学习库的应用,python2.7和python3.6中python解析PDF文件内容库的更新,包括对pdfminer库的详细解释和应 ...

最新文章

  1. 用C#实现的条形码和二维码编码解码器
  2. 太阳花图片_6种漂亮的花,种子已经成熟,别忘采摘种子,来年再播种
  3. Web服务评估工具Nikto
  4. 大型互联网架构概述,看完文章又涨知识了
  5. winform TopMost
  6. STM32工作笔记0034---蜂鸣器实验-M3
  7. 阿里 Nacos 惊爆安全漏洞,火速升级!
  8. Python弹球游戏(tkinter模块编写)
  9. ubuntu20.4 安装配置teamviewer
  10. DBSCAN 聚类算法详解
  11. VM下安装ubuntu教程
  12. java视频生成缩略图_Java调用ffmpeg工具生成视频缩略图实例
  13. 矩阵特征值和特征向量matlab,MATLAB计算矩阵特征值和特征向量
  14. OpenGL——顶点属性
  15. 9步搞定:用迅雷等工具下载百度网盘资源
  16. CentOS 6.X yum源更新(阿里云默认最新更新为CentOS6.10)
  17. 《机器学习》西瓜书课后题7.3
  18. 随机生存森林的模型建立和结果解读
  19. 展示csdn的云服务
  20. Nginx的优化和压力测试

热门文章

  1. 高数:自然数的无穷大符号--->n_max(高等数学的唯一根基所在)
  2. 游戏设计3C之一——角色
  3. IE8_XP安装包.zip
  4. PHP游戏源码寻仙纪,在线多人文字游戏-可联机
  5. 珞珈一号夜间灯光数据评价
  6. 雨听|生成mac风格代码块
  7. LiveGBS国标GB/T28181视频平台获取海康大华宇视摄像机设备通道视频流直播地址 HLS/HTTP-FLV/WS-FLV/WebRTC/RTMP/RTSP直播流地址示例
  8. 并发编程之美-终章chat
  9. 计算机房网络布线培训方案,网络工程综合布线实训授课计划.doc
  10. 很棒的VC界面库 - GuiToolkit