Python合成PDF文件
Python合成PDF文件
最近有一个需求,就是把多个pdf按照xls文件里的规则合并成一个pdf,在网上找了下,没有发现现成的东西,只有自己动手了。
图片
简单来说就是把文件1.pdf,文件2.pdf,文件3.pdf,合并成《合并文件1》,
把文件11.pdf,文件22.pdf,文件33.pdf,合并成《合并文件2》。
理解需求了,就开始写代码了。
首先要读取xls文件就要一个库,openpyxl(pands也可以),这里以openpyxl为例。
加载要使用openpyxl中的具体库:
from openpyxl import load_workbook
加载后开始加载文件
wb = load_workbook('data/source_data.xlsx') #加载具体xlsx文件
sheet1 = wb['source_data'] #加载具体的sheet
接下来就是循环xlsx文件里的内容,开始合成文件了。
for i in range(1, sheet1.max_row):mergePdfName = sheet1.cell(row=i + 1, column=1).valueif mergePdfName is None:print('没有填写待合成的文件名,跳过本次执行')continue# 添加封面文件名字data.append('fm_' + mergePdfName + '.pdf')mergePdfName = mergePdfName + '.pdf'print('开始合成' + mergePdfName)data1.append(mergePdfName)for j in range(1, sheet1.max_column):fileName = sheet1.cell(row=i + 1, column=j + 1).valueif fileName is not None:data.append(fileName)if data:mergepdf(data, "water_" + mergePdfName)data = []
合成方法:
这里用的是pypdf2库
from PyPDF2 import PdfFileReader, PdfFileWriter
def mergepdf(infilelist, outfile):pdfFileWriter = PdfFileWriter()for inFile in infilelist:fileName = 'data/' + inFileif os.path.exists(fileName):pdfReader = PdfFileReader(open(fileName, 'rb'))numPages = pdfReader.getNumPages()for i in range(0, numPages):pageObj = pdfReader.getPage(i)pdfFileWriter.addPage(pageObj)pdfFileWriter.write(open('output/' + outfile, 'wb')) #合成后放在output文件夹下
ok,代码结束了。是不是很简单?
其实还有很多功能可以完成,比如加水印,插入pdf页面内容,文件加密等。
不懂的可以留言。或者关注v 七月之上7,后台留言哦。
Python合成PDF文件相关推荐
- Python绘制PDF文件~超简单的小程序
Python绘制PDF文件 项目简介 这次项目很简单,本次项目课,代码不超过40行,主要是使用 urllib和reportlab模块,来生成一个pdf文件. reportlab官方文档 http:// ...
- gnuradio上怎么使用python文件_使用Python从PDF文件中提取数据
前言 数据是数据科学中任何分析的关键,大多数分析中最常用的数据集类型是存储在逗号分隔值(csv)表中的干净数据.然而,由于可移植文档格式(pdf)文件是最常用的文件格式之一,因此每个数据科学家都应该了 ...
- pdf exe如何提取pdf文件_python应用:如何用python提取pdf文件中的文字
从pdf中提取文字,相信很多人都干过这事,怎么在python中实现呢,今天带大家看看. 第一步导入库 import PyPDF2 第二步导入pdf文件 pdf_file =open('dataset/ ...
- python数据生成pdf,Python生成pdf文件的方法
摘要:这篇Python开发技术栏目下的"Python生成pdf文件的方法",介绍的技术点是"python生成pdf文件.python生成pdf.生成pdf文件.Pytho ...
- 使用Python从PDF文件中提取数据
前言 数据是数据科学中任何分析的关键,大多数分析中最常用的数据集类型是存储在逗号分隔值(csv)表中的干净数据.然而,由于可移植文档格式(pdf)文件是最常用的文件格式之一,因此每个数据科学家都应该了 ...
- Python:PDF文件转图像
Python:PDF文件转图像 什么是PyMuPDF? Python环境下想要将PDF文件转图像,可以使用PyMuPDF库. PyMuPDF是MuPDF的Python绑定-"轻量级PDF和X ...
- 利用Python提取PDF文件中的文本信息
如何利用Python提取PDF文件中的文本信息 日常工作中我们经常会用到pdf格式的文件,大多数情况下是浏览或者编辑pdf信息,但有时候需要提取pdf中的文本,如果是单个文件的话还可以通过复制粘贴来直 ...
- 如何用python修改pdf内容_如何利用python将pdf文件转化为txt文件?
https://www.wukong.com/answer/6579491774144708872/?iid=15906422033&app=news_article&share_an ...
- 使用Python读取pdf文件
学习python,不用再为pdf无法转换而烦恼~~~ 下面我们介绍python读取pdf文件(主要是针对文字部分) 1.打开环境 2.安装pdfminer3k包 可以使用jupyter noteboo ...
- python读取pdf文件_深入学习python解析并读取PDF文件内容的方法
这篇文章主要学习了python解析并读取PDF文件内容的方法,包括对学习库的应用,python2.7和python3.6中python解析PDF文件内容库的更新,包括对pdfminer库的详细解释和应 ...
最新文章
- 用C#实现的条形码和二维码编码解码器
- 太阳花图片_6种漂亮的花,种子已经成熟,别忘采摘种子,来年再播种
- Web服务评估工具Nikto
- 大型互联网架构概述,看完文章又涨知识了
- winform TopMost
- STM32工作笔记0034---蜂鸣器实验-M3
- 阿里 Nacos 惊爆安全漏洞,火速升级!
- Python弹球游戏(tkinter模块编写)
- ubuntu20.4 安装配置teamviewer
- DBSCAN 聚类算法详解
- VM下安装ubuntu教程
- java视频生成缩略图_Java调用ffmpeg工具生成视频缩略图实例
- 矩阵特征值和特征向量matlab,MATLAB计算矩阵特征值和特征向量
- OpenGL——顶点属性
- 9步搞定:用迅雷等工具下载百度网盘资源
- CentOS 6.X yum源更新(阿里云默认最新更新为CentOS6.10)
- 《机器学习》西瓜书课后题7.3
- 随机生存森林的模型建立和结果解读
- 展示csdn的云服务
- Nginx的优化和压力测试
热门文章
- 高数:自然数的无穷大符号--->n_max(高等数学的唯一根基所在)
- 游戏设计3C之一——角色
- IE8_XP安装包.zip
- PHP游戏源码寻仙纪,在线多人文字游戏-可联机
- 珞珈一号夜间灯光数据评价
- 雨听|生成mac风格代码块
- LiveGBS国标GB/T28181视频平台获取海康大华宇视摄像机设备通道视频流直播地址 HLS/HTTP-FLV/WS-FLV/WebRTC/RTMP/RTSP直播流地址示例
- 并发编程之美-终章chat
- 计算机房网络布线培训方案,网络工程综合布线实训授课计划.doc
- 很棒的VC界面库 - GuiToolkit