python PDF文件拆分与合并
背景
因工作需要拆分、合并PDF,网上的工具都带有水印。故写代码自己分割PDF、合并PDF。
环境
1、安装PyCharm Community Edition 2021.3.1
2、安装python 工具包
pip install os
pip instsall PyPDF2
代码
1、拆分
from PyPDF2 import PdfFileWriter, PdfFileReaderdef pdf_separate(pdf_in,pdf_out,start,end):# 初始化一个pdfoutput = PdfFileWriter()# 读取pdfwith open(pdf_in, 'rb') as in_pdf:pdf_file = PdfFileReader(in_pdf)# 从pdf中取出指定页for i in range(start, end):output.addPage(pdf_file.getPage(i))# 写出pdfwith open(pdf_out, 'ab') as out_pdf:output.write(out_pdf)
2、合并
import os
from PyPDF2 import PdfFileMergerdef pdf_merge(pdf_in,pdf_out):#初始化一个PDFfile_merger = PdfFileMerger()#读取PDFpdf_lst = [f for f in os.listdir(pdf_in) if f.endswith('.pdf')]pdf_lst = [os.path.join(pdf_in, filename) for filename in pdf_lst]#合并for pdf in pdf_lst:file_merger.append(pdf,import_bookmarks=False) # 合并pdf文件file_merger.write(pdf_out)
使用
拆分
if __name__ == '__main__':pdf_in = r'C:\Users\ss\Desktop\img\02-发票未报销.pdf'pdf_out = r'C:\Users\ss\Desktop\img\02-发票2.pdf'start, end = 0, 1 # 拆分的起始位置和结束位置 想拆哪部分就拆哪部分pdf_separate(pdf_in, pdf_out, start, end)
合并
if __name__ == '__main__':pdf_in = r'C:\Users\ss\Desktop\img'pdf_out = r'C:\Users\ss\Desktop\img\发票.pdf'pdf_merge(pdf_in,pdf_out)
python PDF文件拆分与合并相关推荐
- PDF文件拆分合并器PDF Merge PDF Splitter + Mac
PDF Merge & PDF Splitter + Mac是专为Mac用户所提供的PDF文件拆分合并器,PDF Merge & PDF Splitter + Mac版能够为您将快速多 ...
- JAVA学习路01——使用JAVA将“.txt”文件拆分、合并
一段ToyCode,作用是将".txt"文件拆分并合并. package com.xxxxx; import java.io.BufferedInputStream; import ...
- 怎么将PDF文件拆分成多个文件?2个方法帮你搞定
PDF格式在日常办公学习中经常被使用,因为它不仅易于阅读和浏览,而且文件大小相对较小,兼容性也很强.然而,有时候当PDF文件内容较多时,找到文件中重要内容可能会变得困难.为了解决这个问题,我们可以尝试 ...
- 将PDF文件拆分成多个文件的教程
毕业的大学生都要写论文,这是很重要的一个环节,但是论文不像我们平时编辑资料一样,只要差不多就可以交,但是论文不一样.我们到网上采集资料的时候,都是都是PDF格式的文件偏多,所以我们的就很苦恼,下载之后 ...
- 如何用PDF编辑器将PDF文件拆分
PDF文件的使用频率现在还是很高的,不止使用PDF文件编辑PDF文件也挺多的,但是大家都知道怎么编辑PDF文件吗?知道文档的拆分要怎么做吗?说到PDF文件的拆分小编想到了文件的拆分与页面的拆分,接下来 ...
- 怎么把PDF文件拆分,PDF拆分软件怎么操作
怎么把PDF文件拆分呢?想要拆分PDF文件就需要使用专业的PDF编辑器来进行操作,但是现在很多人对于PDF编辑器不熟悉,不知道PDF编辑器怎么拆分PDF文件,说起PDF拆分,小编推荐使用迅捷PDF编辑 ...
- 怎么把PDF文件拆分开来?教你两种拆分方法
一份PDF文件,我们如何能够将它的内容给拆分开来呢?大家都知道,PDF文件是不容易改动的,但是我们在工作中又经常使用到它,这就难免会遇到需要编辑的PDF文件,其中就有遇到文件内容特别多的PDF文件,我 ...
- Leadtools Document教程:如何高效将数千个 PDF 文件拆分并转换为单页图像
LEADTOOLS Document Suite SDK是LEADTOOLS SDK功能的全面集合,旨在构建需要OCR,MICR,OMR,ICR,条形码,表单识别和处理,PDF,HTML5 / Jav ...
- Python PDF文件转Word格式
1.免费在线转换网站 PDF转换器,限制50页: http://pdfdo.com/pdf-to-word.aspx 迅捷PDF转换器,限制2M: http://app.xunjiepdf.com/p ...
- PDF文件拆分方法?教你几步解决!
对于上班族来说,有很多人的工作是需要每天跟很多不同的文件格式打交道,而PDF文件就是其中的一种,但这种格式的文件比较特殊,有时在处理PDF文档的时候,会发现有些页面是多个页面合成一个页面的,这样在浏览 ...
最新文章
- Android自动化测试之MonkeyRunner录制和回放脚本
- 【51nod - 1174 】区间中最大的数(RMQ问题,ST表,模板)
- java sub,Java 9子软件包跨模块拆分
- Windows 2000缓冲区溢出入门
- num_workers设置
- 2017.9.8 仙人掌图 失败总结
- python继承属性_python继承,属性查找顺序
- php 微商城 开源,微商城开通为什么选php开源网店系统
- jetpack的camerax_Android开发-Jetpack组件CameraX
- Python画数码晶体管日期(年月日时分秒)
- k8s springboot 文件_30分钟无痛上云——springboot项目部署到kubernetes
- CrowdSec:行为检测引擎
- 可以嵌入ppt的课堂点名器_学点云课堂:小班课应用场景,饱受青睐的秘诀
- 顺丰快递 : 请收下 MySQL 灵魂十连
- 台式机尺寸相关信息整理
- 指纹识别综述(3): 特征提取
- android 仿微信账单生成器手机版式,2020微信年度账单生成器
- 用C语言图形库画一个红色爱心
- 谷歌发布 12 款 Chrome 新皮肤
- 成长感悟:谁定义了你的大学生活