""" 用途:将一个 PDF 文件按页拆分为多个 PDF 文件注意事项:若报错 ModuleNotFoundError: No module named 'PyPDF2'则需要先安装该模块。使用命令 “pip install PyPDF2” 安装即可
"""import PyPDF2  # 需要先安装:pip/pip3 install PyPDF2
import osroot = r'C:\Users\liujieru\Documents\pdf'  # 源文件所在的绝对路径
file_path = os.path.join(root, '组合.pdf')pdf_file = open(file_path, 'rb')  # 获取原 PDF 文件
pdf_reader = PyPDF2.PdfFileReader(pdf_file)  # 创建 PDF 对象
source_name = pdf_file.name  # 获取源文件名称,包含绝对路径pdf_writer = PyPDF2.PdfFileWriter()  # 创建一个空白 PDF 对象for page_num in range(pdf_reader.numPages):  # 将每页内容分别写入一个新文件page_obj = pdf_reader.getPage(page_num)pdf_writer.addPage(page_obj)  # 向空白 PDF 对象中添加要复制的 PDF页面new_name = source_name[:-4] + str(page_num) + ".pdf"pdf_new_file = open(new_name, 'wb')  # 创建一个新文件pdf_writer.write(pdf_new_file)  # 将添加了内容的空白 PDF 对象,写入到新建文件中pdf_new_file.close()pdf_writer.__init__()  # 将 PDF 对象初始化pdf_file.close()

使用 Python 将 PDF 文件按页进行拆分相关推荐

  1. 【Python】pdf文件逐页转图片/修改图片存储大小脚本

    在项目APP开发过程中需要将pdf文件逐页转成图片,并同时修改图片的大小(磁盘大小有要求而尺寸大小不作要求),研究了一下通过Python的"PyPDF2"库(参考:http://b ...

  2. python读取PDF文件中跨页表格思路分享

    目录 背景 背景知识 实现思路 1.判断当前页面是否以表格结尾 2.判断下一页面是否以表格开头 3.注意事项 参考 背景 最近需要读取PDF文件中的表格,遇到的一个难点之一是如何识别并合并PDF中跨页 ...

  3. 用python汇总pdf文件_Python处理PDF文件-简译与总结

    最近看到一篇介绍Python中pyPDF模块的文章,详细介绍了使用pyPDF模块获取PDF文件信息,合并拆分PDF文件等功能.很方便,在此搬运分享以下: 全文介绍了以下几方面的功能 提取文件信息 旋转 ...

  4. pdf exe如何提取pdf文件_python应用:如何用python提取pdf文件中的文字

    从pdf中提取文字,相信很多人都干过这事,怎么在python中实现呢,今天带大家看看. 第一步导入库 import PyPDF2 第二步导入pdf文件 pdf_file =open('dataset/ ...

  5. Python:PDF文件转图像

    Python:PDF文件转图像 什么是PyMuPDF? Python环境下想要将PDF文件转图像,可以使用PyMuPDF库. PyMuPDF是MuPDF的Python绑定-"轻量级PDF和X ...

  6. python读取pdf文件_深入学习python解析并读取PDF文件内容的方法

    这篇文章主要学习了python解析并读取PDF文件内容的方法,包括对学习库的应用,python2.7和python3.6中python解析PDF文件内容库的更新,包括对pdfminer库的详细解释和应 ...

  7. python读取pdf文件

    使用python读取pdf文件的内容 读取第1页的内容: import PyPDF2 pdfFileObj = open('a.pdf', 'rb') pdfReader = PyPDF2.PdfFi ...

  8. 8、【办公自动化】Python实现PDF文件的批量操作

    说明 平时工作中,经常会和 PDF 文件打交道,比如,合并.拆分.加解密.添加和去除水印.提取指定内容.转换成其他文件格式等操作.如果只是处理单个 PDF 文件的话,有些操作是比较简单的,而如果需要批 ...

  9. python 处理PDF文件

    python PDF 文档转图片 """ 将PDF文档每一页提取为图片 """ import fitz import osdef mkdir ...

最新文章

  1. Alpha版本项目展示
  2. 回答跨专业考研者的几点疑问(计算机考研)
  3. STM32cube HAL库 UART串口中断方式收发任意长度 调试笔记
  4. 【Linux】一步一步学Linux——usermod命令(86)
  5. MobileIron Access保障移动设备的企业云数据安全
  6. 初识HTML、CSS
  7. Unity3D笔记 愤怒的小鸟五 小鸟动画+Unity3D如何设置断点调式
  8. 推箱子如何实现悔步_推箱子时代又来临,表里世界会发生什么?
  9. mysql银行储蓄额度格式_mysql创建表用于银行储蓄系统
  10. a ppt of CRF
  11. 解析数论 1: Fourier积分和Fourier变换
  12. matlab水汽计算公式,饱和水汽压的计算
  13. 中柏平板刷linux教程,中柏 ezpad 平板安装Fedora 21 (Linux)
  14. 使用Windows批处理文件递归删除当前路径下的指定文件夹
  15. 漫威首部华人英雄电影
  16. java游戏 飞机对战
  17. 人脸识别智能服务器,智能化人脸识别服务器
  18. Js模拟重力场【Js动效】
  19. ChinaSkills-网络系统管理(2021年全国职业院校技能大赛A-1 模块 A:Linux 环境 评分标准 )
  20. 单机安装Hive和Zepplin

热门文章

  1. IDEA try catch快捷键、 快速生成get set 方法快捷键、快速生成有参和无参构造方法快捷键
  2. 工业触屏没有反应的原因?
  3. qt android 浮动窗口,QT+ 状态栏+核心控件+浮动窗口
  4. 大陆首款车量AI芯片 开启国产替代新纪元
  5. 上交凯原|法学大陆天花板,本外校录取比1:9,双非含量高达12% | 上海交通大学凯原法学院2022届推免大数据
  6. css 实现条纹背景效果
  7. 深度学习之空洞卷积(Dilated/Atrous Convolution)
  8. 电脑连接不上手机热点-始终显示无法连接到该网络的解决办法(亲测管用)
  9. 40G SR4 vs 40G BIDI vs 40G UNIV:你选哪个?
  10. 【亲测】原神3.2+文本教程+视频教程+GM工具