python分页PDF
记录python分页PDF[待完善]
#!/usr/bin/env python
# coding=utf-8from PyPDF2 import PdfFileReader, PdfFileWriter# PDF文件分割
def split_pdf():try:read_file = r"C:\Users\71694\Desktop\test.pdf" # 要分页PDF的路径fp_read_file = open(read_file, 'rb')pdf_input = PdfFileReader(fp_read_file) # 将要分割的PDF内容格式话page_count = pdf_input.getNumPages() # 获取PDF页数print("该文件共有{}页".format(page_count)) # 打印页数out_detail=r"C:\Users\71694\Desktop\1.txt" # 分页之后命名文件with open(out_detail, 'r',True,'utf-8')as fp:# print(fp)txt = fp.readlines()# print(txt)for detail in txt: # 打开分割标准文件# print(type(detail))pages, write_file = detail.split() # 空格分组# write_file, write_ext = os.path.splitext(write_file) # 用于返回文件名和扩展名元组pdf_file = f'{write_file}.pdf'# liststr=list(map(int, pages.split('-')))# print(type(liststr))start_page, end_page = list(map(int, pages.split('-'))) # 将字符串数组转换成整形数组start_page -= 1try:print(f'开始分割{start_page}页-{end_page}页,保存为{pdf_file}......')pdf_output = PdfFileWriter() # 实例一个 PDF文件编写器for i in range(start_page, end_page):pdf_output.addPage(pdf_input.getPage(i))with open(pdf_file, 'wb') as sub_fp:pdf_output.write(sub_fp)print(f'完成分割{start_page}页-{end_page}页,保存为{pdf_file}!')except IndexError:print(f'分割页数超过了PDF的页数')# fp.close()except Exception as e:print(e)if __name__ == '__main__':split_pdf()
命名文件1.txt格式
1-1 test [第一页到第一页分页为test.pdf]
1-1 test
2-2 test2
3-3 test3
python分页PDF相关推荐
- 手把手教你如何用Python从PDF文件中导出数据(附链接)
作者:Mike Driscoll :翻译:季洋:校对:丁楠雅 本文约4000字,建议阅读10分钟. 本文介绍了在提取出想要的数据之后,如何将数据导出成其他格式的方法. 有很多时候你会想用Python从 ...
- Python 读pdf数据写入Excel表中
活动地址:CSDN21天学习挑战赛 目录 一.Python操作PDF的库有很多 二.pdflumber作为案例讲解使用 2.安装配置 2.加载PDF 3.读取pdf文档信息 1)读取pdf文档 ...
- 8、【办公自动化】Python实现PDF文件的批量操作
说明 平时工作中,经常会和 PDF 文件打交道,比如,合并.拆分.加解密.添加和去除水印.提取指定内容.转换成其他文件格式等操作.如果只是处理单个 PDF 文件的话,有些操作是比较简单的,而如果需要批 ...
- Python自动化办公系列之Python操作PDF
点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 输 作者介绍: 大家可以叫我黄同学(博客名:Huang Supre ...
- python怎么玩pdf_最全总结!聊聊 python 操作PDF的几种方法
作者:陈熹 来源:早起Python 一.前言 大家好,有关Python操作PDF的案例之前已经写过一个PDF批量合并,这个案例初衷只是给大家提供一个便利的脚本,并没有太多讲解原理,其中涉及的就是PDF ...
- python pdf-浅谈Python处理PDF的方法
处理pdf文档 第一. 从文本中提取文本 第二. 创建PDF 两种方法 #使用PdfFileWriter import PyPDF2 pdfFiles = [] for filename in os. ...
- 疯狂python讲义视频 百度云-疯狂Python讲义 PDF高清版附源码
内容简介 本书全面,深入地介绍了Python编程的相关内容,大致可分为四个部分.*系统部分介绍了Python的基本语法结构,函数编程,类和对象,模块和包,异常处理等: 第二部分主要介绍Python常用 ...
- python csv转excel_使用 Python 把 PDF 转为 CSV 和 Excel(一)
杭州国立公证处-公正摇号 会不定期公布杭州各个楼盘的购房意向登记汇总表和摇号结果,里面公开的数据是很全面的,对于想要分析一波数据搞点事情的人来说,挺有吸引力的. 但当你兴冲冲地去官网下载完数据,一看傻 ...
- Python处理PDF与CDF
在拿到数据后,最需要做的工作之一就是查看一下自己的数据分布情况.而针对数据的分布,又包括pdf和cdf两类. 下面介绍使用python生成pdf的方法: 使用matplotlib的画图接口hist() ...
- python读取pdf表格_【Python 库】解析PDF文本及表格——pdfminer、tabula、pdfplumber 的用法及对比...
pdf 是个异常坑爹的东西,有很多处理 pdf 的库,但是没有完美的. 一.pdfminer3k pdfminer3k 是 pdfminer 的 python3 版本,主要用于读取 pdf 中的文本. ...
最新文章
- ubuntu下启动和关闭tomcat的简单方法
- CoreOS的Tectonic新发行版支持Kubernetes自我管理
- 串口初始化结构体和固件库讲解
- 广义线性模型——逻辑回归(logistic regression)
- 银联无卡涉及关键词整理
- 计算机信息技术知识点思维导图,思维导图信息技术的学习方法
- Emmagee——开源Android性能测试工具
- linux怎么看本机ip,linux下查看本机IP的两种方法
- 训练误差和泛化误差、K折交叉验证
- Altium Designer 总结
- 【渝粤教育】电大中专Windows操作系统_1作业 题库
- vue 创建一个 表格,横向纵向都可以增加(减少)行和列,并且内容内容可以输入,标题可以修改
- 【WebAPI 验证】给 webapi加上token 验证(包括上传文件方法)
- c# 计算圆锥的体积_用C#如何编写程序计算球,圆柱和圆锥的表面积和体积?
- 当我们说“嘿,siri”时,会发生什么?
- mysql云化方案_云原生下,如何实现高可用的MySQL?
- 好多人一个月3000块钱工资怎么维持生活的?
- LX弹幕wss弹幕RPC
- linux串口卡驱动下载,ch350l驱动
- GDUT 排位赛2.19 D
热门文章
- 常用的SEO工具都有哪些呢?5个SEO必备优化工具推荐
- 怎么更改计算机的注册表,Windows如何一键修改注册表
- 计算机通过注册表修改摄像机设备的名称
- 转载:用图片搜索图片的几个好网站
- 软件概要设计文档编写
- 2018北京java面试心得体会(一年经验)
- PHP发卡自动源码,PHP自动化售货发卡网源码
- 项目管理:系统需求分析模板
- 第一本微服务网关图书上市,详解 GitHub 28.3k+ 标星项目 Kong
- 在 Windows XP Embedded 中使用 Enhanced Write Filter (EWF)[微软影子系统]