使用 Python 将 PDF 文件按页进行拆分
""" 用途:将一个 PDF 文件按页拆分为多个 PDF 文件注意事项:若报错 ModuleNotFoundError: No module named 'PyPDF2'则需要先安装该模块。使用命令 “pip install PyPDF2” 安装即可
"""import PyPDF2 # 需要先安装:pip/pip3 install PyPDF2
import osroot = r'C:\Users\liujieru\Documents\pdf' # 源文件所在的绝对路径
file_path = os.path.join(root, '组合.pdf')pdf_file = open(file_path, 'rb') # 获取原 PDF 文件
pdf_reader = PyPDF2.PdfFileReader(pdf_file) # 创建 PDF 对象
source_name = pdf_file.name # 获取源文件名称,包含绝对路径pdf_writer = PyPDF2.PdfFileWriter() # 创建一个空白 PDF 对象for page_num in range(pdf_reader.numPages): # 将每页内容分别写入一个新文件page_obj = pdf_reader.getPage(page_num)pdf_writer.addPage(page_obj) # 向空白 PDF 对象中添加要复制的 PDF页面new_name = source_name[:-4] + str(page_num) + ".pdf"pdf_new_file = open(new_name, 'wb') # 创建一个新文件pdf_writer.write(pdf_new_file) # 将添加了内容的空白 PDF 对象,写入到新建文件中pdf_new_file.close()pdf_writer.__init__() # 将 PDF 对象初始化pdf_file.close()
使用 Python 将 PDF 文件按页进行拆分相关推荐
- 【Python】pdf文件逐页转图片/修改图片存储大小脚本
在项目APP开发过程中需要将pdf文件逐页转成图片,并同时修改图片的大小(磁盘大小有要求而尺寸大小不作要求),研究了一下通过Python的"PyPDF2"库(参考:http://b ...
- python读取PDF文件中跨页表格思路分享
目录 背景 背景知识 实现思路 1.判断当前页面是否以表格结尾 2.判断下一页面是否以表格开头 3.注意事项 参考 背景 最近需要读取PDF文件中的表格,遇到的一个难点之一是如何识别并合并PDF中跨页 ...
- 用python汇总pdf文件_Python处理PDF文件-简译与总结
最近看到一篇介绍Python中pyPDF模块的文章,详细介绍了使用pyPDF模块获取PDF文件信息,合并拆分PDF文件等功能.很方便,在此搬运分享以下: 全文介绍了以下几方面的功能 提取文件信息 旋转 ...
- pdf exe如何提取pdf文件_python应用:如何用python提取pdf文件中的文字
从pdf中提取文字,相信很多人都干过这事,怎么在python中实现呢,今天带大家看看. 第一步导入库 import PyPDF2 第二步导入pdf文件 pdf_file =open('dataset/ ...
- Python:PDF文件转图像
Python:PDF文件转图像 什么是PyMuPDF? Python环境下想要将PDF文件转图像,可以使用PyMuPDF库. PyMuPDF是MuPDF的Python绑定-"轻量级PDF和X ...
- python读取pdf文件_深入学习python解析并读取PDF文件内容的方法
这篇文章主要学习了python解析并读取PDF文件内容的方法,包括对学习库的应用,python2.7和python3.6中python解析PDF文件内容库的更新,包括对pdfminer库的详细解释和应 ...
- python读取pdf文件
使用python读取pdf文件的内容 读取第1页的内容: import PyPDF2 pdfFileObj = open('a.pdf', 'rb') pdfReader = PyPDF2.PdfFi ...
- 8、【办公自动化】Python实现PDF文件的批量操作
说明 平时工作中,经常会和 PDF 文件打交道,比如,合并.拆分.加解密.添加和去除水印.提取指定内容.转换成其他文件格式等操作.如果只是处理单个 PDF 文件的话,有些操作是比较简单的,而如果需要批 ...
- python 处理PDF文件
python PDF 文档转图片 """ 将PDF文档每一页提取为图片 """ import fitz import osdef mkdir ...
最新文章
- Alpha版本项目展示
- 回答跨专业考研者的几点疑问(计算机考研)
- STM32cube HAL库 UART串口中断方式收发任意长度 调试笔记
- 【Linux】一步一步学Linux——usermod命令(86)
- MobileIron Access保障移动设备的企业云数据安全
- 初识HTML、CSS
- Unity3D笔记 愤怒的小鸟五 小鸟动画+Unity3D如何设置断点调式
- 推箱子如何实现悔步_推箱子时代又来临,表里世界会发生什么?
- mysql银行储蓄额度格式_mysql创建表用于银行储蓄系统
- a ppt of CRF
- 解析数论 1: Fourier积分和Fourier变换
- matlab水汽计算公式,饱和水汽压的计算
- 中柏平板刷linux教程,中柏 ezpad 平板安装Fedora 21 (Linux)
- 使用Windows批处理文件递归删除当前路径下的指定文件夹
- 漫威首部华人英雄电影
- java游戏 飞机对战
- 人脸识别智能服务器,智能化人脸识别服务器
- Js模拟重力场【Js动效】
- ChinaSkills-网络系统管理(2021年全国职业院校技能大赛A-1 模块 A:Linux 环境 评分标准 )
- 单机安装Hive和Zepplin
热门文章
- IDEA try catch快捷键、 快速生成get set 方法快捷键、快速生成有参和无参构造方法快捷键
- 工业触屏没有反应的原因?
- qt android 浮动窗口,QT+ 状态栏+核心控件+浮动窗口
- 大陆首款车量AI芯片 开启国产替代新纪元
- 上交凯原|法学大陆天花板,本外校录取比1:9,双非含量高达12% | 上海交通大学凯原法学院2022届推免大数据
- css 实现条纹背景效果
- 深度学习之空洞卷积(Dilated/Atrous Convolution)
- 电脑连接不上手机热点-始终显示无法连接到该网络的解决办法(亲测管用)
- 40G SR4 vs 40G BIDI vs 40G UNIV:你选哪个?
- 【亲测】原神3.2+文本教程+视频教程+GM工具