今天心血来潮,就写了一个pdf分页的函数。想到某些商家分个页还要money。哎,自己动手风衣足食。

1.这是我的输入的文件

2. python代码如下

import os
from PyPDF2 import PdfFileReader, PdfFileWriter#参数                 pdf文件位置 页数大小
def pdfPageingAndSize(filePath,pageSize=1):fileDir,fileName=os.path.split(filePath)fileNameExceptSuffix=fileName.split('.')[0]#创建输出文件夹outputDir=str(fileNameExceptSuffix)+"_pdf_output_dir"os.mkdir(os.path.join(fileDir,outputDir))#输出文件夹的路径OutputDirFile=os.path.join(fileDir,outputDir)inputPdf = PdfFileReader(filePath, "rb")# 获得源PDF文件中页面总数pageNumber = inputPdf.getNumPages()print("页数:%d"%pageNumber)count=0output = PdfFileWriter()for index in range(pageNumber):count+=1output.addPage(inputPdf.getPage(index))outPdfName='1-'+str(count)+'.pdf'#每隔pageSize个页做一个pdfif(count%pageSize==0):outPdfName="pages-"+str(count-pageSize+1)+"-"+str(count)+'.pdf'outputStream = open(os.path.join(OutputDirFile, outPdfName), "wb")output.write(outputStream)outputStream.close()output = PdfFileWriter()#如果有些pdf不是pageSize的倍数,则需要单独保存if(pageNumber%pageSize):number=pageNumber%pageSizestart=pageNumber-number+1end=pageNumberoutPdfName="pages-"+str(start)if(start!=end):outPdfName=outPdfName+"-"+str(end)outPdfName=outPdfName+'.pdf'outputStream = open(os.path.join(OutputDirFile, outPdfName), "wb")output.write(outputStream)outputStream.close()filePath=r"C:\Users\xxx\Desktop\pdf\1.pdf"
pdfPageingAndSize(filePath,pageSize=5)

3、输出

结果如下:

代码中还有不少需要修改的地方,有需要的朋友自行修改吧!!!
上一篇文章:python之pdf合并

python之pdf分页相关推荐

  1. python 将pdf分页后插入至word中

    所用技术 1. python编程基础 2. 使用pyPdf 3. 使用python操作word 4. 正则表达式的使用 5. windows的bat编程 下面是一个pyPdf库使用的示例: from ...

  2. 手把手教你如何用Python从PDF文件中导出数据(附链接)

    作者:Mike Driscoll :翻译:季洋:校对:丁楠雅 本文约4000字,建议阅读10分钟. 本文介绍了在提取出想要的数据之后,如何将数据导出成其他格式的方法. 有很多时候你会想用Python从 ...

  3. Python合并PDF

    文章目录 1.前言 2.安装 3.使用 4.参考 1.前言 最近做爬虫的时候需要将爬取的pdf分页文件合并成一个pdf文件,就想着python有没有什么库能够实现.通过简单搜索,发现了Pypdf2. ...

  4. Python 读pdf数据写入Excel表中

    ​ ​ 活动地址:CSDN21天学习挑战赛 目录 一.Python操作PDF的库有很多 二.pdflumber作为案例讲解使用 2.安装配置 2.加载PDF 3.读取pdf文档信息 1)读取pdf文档 ...

  5. 8、【办公自动化】Python实现PDF文件的批量操作

    说明 平时工作中,经常会和 PDF 文件打交道,比如,合并.拆分.加解密.添加和去除水印.提取指定内容.转换成其他文件格式等操作.如果只是处理单个 PDF 文件的话,有些操作是比较简单的,而如果需要批 ...

  6. Python自动化办公系列之Python操作PDF

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 输 作者介绍: 大家可以叫我黄同学(博客名:Huang Supre ...

  7. python怎么玩pdf_最全总结!聊聊 python 操作PDF的几种方法

    作者:陈熹 来源:早起Python 一.前言 大家好,有关Python操作PDF的案例之前已经写过一个PDF批量合并,这个案例初衷只是给大家提供一个便利的脚本,并没有太多讲解原理,其中涉及的就是PDF ...

  8. python pdf-浅谈Python处理PDF的方法

    处理pdf文档 第一. 从文本中提取文本 第二. 创建PDF 两种方法 #使用PdfFileWriter import PyPDF2 pdfFiles = [] for filename in os. ...

  9. 疯狂python讲义视频 百度云-疯狂Python讲义 PDF高清版附源码

    内容简介 本书全面,深入地介绍了Python编程的相关内容,大致可分为四个部分.*系统部分介绍了Python的基本语法结构,函数编程,类和对象,模块和包,异常处理等: 第二部分主要介绍Python常用 ...

  10. python csv转excel_使用 Python 把 PDF 转为 CSV 和 Excel(一)

    杭州国立公证处-公正摇号 会不定期公布杭州各个楼盘的购房意向登记汇总表和摇号结果,里面公开的数据是很全面的,对于想要分析一波数据搞点事情的人来说,挺有吸引力的. 但当你兴冲冲地去官网下载完数据,一看傻 ...

最新文章

  1. 员工拒绝加班,被判赔公司1.8万!网友炸锅
  2. laravel中Crypt加密方法
  3. MySQL批量检查表的脚本
  4. Sparsity稀疏编码(三)
  5. leetcode 278. 第一个错误的版本(Java版)
  6. ios html正则表达式,ios 正则表达式去html标签
  7. jq父级绑定事件的意义_js、jq事件绑定方式总结——以click事件为例
  8. Web程序中将Cell华表的修改 保存到数据库或服务器端文件夹内
  9. html背景只向x轴扩散,有趣的css—简单的下雨效果2.0版
  10. java异常错误的是,java 异常 错误处理
  11. 计算机组成原理 第四章 指令系统
  12. bgll算法 matlab,一种复杂网络社区检测的方法与流程
  13. python histogram函数_python (ploit2)(histogram)
  14. 在函数‘_start’中:对‘main’未定义的引用
  15. 利用matlab符号变量进行矩阵乘法公式推导
  16. 【vue】bable的介绍以及编写vue文件
  17. L. Ray in the tube(思维暴力)
  18. Django-应用app名配置中文显示
  19. C语言基础之数据类型和数据的表现形式
  20. 字符串转浮点数(Python)

热门文章

  1. 【Cadence16.6】安装教程
  2. 勤哲excel服务器端口协议,勤哲EXCEL服务器2017版工作流定义方式及无限制版本非高低配单服务器版,不绑定服务...
  3. Android版本历史变迁
  4. Chrome浏览器下载
  5. Vue项目整体添加加载中Loading页面
  6. 数学建模美赛该如何准备?
  7. gephi java教程_如何使用java 生成gephi类似使用YifanHu's Multilevel算法生成的gexf文件?...
  8. 浏览器辅助神器:油猴脚本使用教程
  9. 微软Win11 商店各个应用可单独下载
  10. 黑客入侵电脑网络四大步骤全面曝光