python实现pdf合并
前言
使用wps合并pdf, ppt,居然还要wps超级会员, wps会员留下伤心的眼泪…
另一片相关: python下将图片合成pdf
刚好和这篇文章差不多是逆操作 python选择制定页码提取出子pdf
PyPDF2
代码修改自 https://cloud.tencent.com/developer/article/1627099
import os
from PyPDF2 import PdfFileReader, PdfFileWriterdef GetFileName(dir_path):file_list = [os.path.join(dirpath, filesname) \for dirpath, dirs, files in os.walk(dir_path) \for filesname in files]file_list.sort()return file_listdef MergePDF(dir_path, file_name):output = PdfFileWriter()outputPages = 0file_list = GetFileName(dir_path)print(file_list)for pdf_file in file_list:file_type = pdf_file.split('\\')[-1].split('.')[-1]if file_type != 'pdf':continueprint("文件:%s" % pdf_file.split('\\')[-1], end=' ')# 读取PDF文件input = PdfFileReader(open(pdf_file, "rb"))# 获得源PDF文件中页面总数pageCount = input.getNumPages()outputPages += pageCountprint("页数:%d" % pageCount)# 分别将page添加到输出output中for iPage in range(pageCount):output.addPage(input.getPage(iPage))print("\n合并后的总页数:%d" % outputPages)# 写入到目标PDF文件print("PDF文件正在合并,请稍等......")with open(os.path.join(dir_path, file_name), "wb") as outputfile:output.write(outputfile)print("PDF文件合并完成")if __name__ == '__main__':# 设置存放多个pdf文件的文件夹dir_path = r'H:/大三下/大物/课件/11pdf'# 目标文件的名字file_name = "第十一章全集.pdf"MergePDF(dir_path, file_name)
这里我合并的情况是这样子的,我想要把大物11章11个pdf合并起来,方便放到平板上查看。大家用的时候只需要去pip install PyPDF2, 在main函数那里传参改变一下路径就可以了。
输出结果
可以看到是源文件夹目录下生成了
注意事项
- 大家记得重新跑的时候要删除这个pdf(合并后的)再跑哈。
或者可以这样,在write之前添加判断,若存在则删除if os.path.exists("allimages.pdf"):os.remove("allimages.pdf") with open(os.path.join(dir_path, file_name), "wb") as outputfile:output.write(outputfile)
+ 命名记得按顺序,如果是超过10注意个位数前添加0, 不然顺序可能会乱hhh.
python实现pdf合并相关推荐
- python处理PDF合并、拆分、删除、转换
目录 PDF合并.拆分.删除页面 图片转PDF 举例 PDF合并.拆分.删除页面 2种合并方式:多个文件合并为一个文件,在文件中插入其他文件页面 2种分割方式:文件分割为固定页数,分割提取连续多页 2 ...
- Python实现按序合并多个pdf文件
技术交流QQ群:1027579432,欢迎你的加入! 欢迎关注我的微信公众号:CurryCoder的程序人生 1.整体实现步骤 在日常办公中,我们可能会有一个需求,需要将多个pdf文件合并成一个文件. ...
- python文件下载器代码_GitHub - applechi/pythonCollection: python代码集合(文件下载器、pdf合并、极客时间专栏下载、掘金小册下载、新浪微博爬虫等)...
json2mysql 这次更新了将一个json文件中的数据导入到mysql的脚本. 是用nodejs写的. 对应的文件是tomysql.js 有兴趣的同志可以研究下. pythonCollection ...
- pdf 改变页面大小 python_用Python开发PDF编辑器,实现PDF页面提取,页面合并与替换...
对于PDF页面提取,我们的开发思路是这样子的.我们设计一个表单,让用户上传一个PDF文件并输入提取页面号码.服务器在收到PDF文件后使用PyPDF2读取用户上传的PDF文件,提取我们所需要的页面,然后 ...
- python处理pdf文件的程序_Python处理PDF文档-拆分合并
使用Python处理PDF文档.将需要处理的PDF文档与处理程序放到一个新建的文件夹中.运行程序. S模式,将单个PDF文档拆分到单页,并以数字命名. image.png C模式,合并文档,需要提前将 ...
- 【学习笔记】Python之 pdf 下载、合并
pdf下载 import requests# python requests 的pdf 文档 requests_pdf_url = "https://link.springer.com/co ...
- python多图片合并pdf_Python结合ImageMagick实现多张图片合并为一个pdf文件的方法
本文实例讲述了Python结合ImageMagick实现多张图片合并为一个pdf文件的方法.分享给大家供大家参考,具体如下: 前段时间买了不少书,现在手头的书籍积累的越来越多,北京这边租住的小屋子空间 ...
- Python实现PDF文件合并
PDF是我们目前办公处理的一种重要文件格式,目前商用PDF浏览器一般对合并PDF功能有权限限制,下面介绍利用Python实现多个PDF合并的方法,以实现更高效便捷的PDF文件合并需求. 实现步骤分成三 ...
- 使用python开发一个pdf合并工具
老婆给女儿整理打印学习资料,希望能从很多个pdf中抽取一些页码来合并成一个文件, 就希望我能写一个程序来实现这个功能.刚好最近正在学习python,就用python开发了一个 pdf合并工具,也算是学 ...
- python 知乎 合并 pdf_实例4:用Python提取不同PDF文件中的页面合并进新的PDF文件...
公司船务部一个重要任务就是需要准备每单货物的发票,从系统导出发票时是默认存为一个PDF文档,在打印的时候,有多少个文件,就需要点多少次"打印".如果能够将当天的发票PDF档合并在一 ...
最新文章
- 独家 | Kaggle 大神Dan Becker与你分享他的数据科学之旅!
- 搞科研不如当老师香?南科大助理教授“跳槽”深圳中学当老师
- 编写一个自己的完全C语言版本的memset函数,并且评价这个实现的性能和可移植性。
- albumentations 安装
- 多线程通信—生产者和消费者模式
- 【Qt】Visual Studio中无法打开Qt中UI文件
- 02全志r58平台Android4.4.4下关闭内核中的CPU的开启关闭提示
- Pytorch:保存图片
- RxJava系列(二)Scheduler线程调度器
- 值转换成布尔类型的False;
- 设计一个线程安全的单例(Singleton)模式
- Matlab系列教程_数值计算_最值、平均值、中值
- c语言经典题100及答案,100个经典c语言例题(带答案)
- 淘宝网购物车jquery源码和网易新用户注册页面表单验证的练习
- HTML制作qq空间主页
- 免费域名注册 freenom
- 【Windows 逆向】CE 地址遍历工具 ( CE 结构剖析工具 | 人物数据内存结构 | 人物三维坐标数据分析 )
- 微信跳一跳游戏的脚本
- 人力资源管理系统如何促进业务增长
- SQLSERVER2000--验证码一直不能通过验证