记录python分页PDF[待完善]

#!/usr/bin/env python
# coding=utf-8from PyPDF2 import PdfFileReader, PdfFileWriter# PDF文件分割
def split_pdf():try:read_file = r"C:\Users\71694\Desktop\test.pdf" #  要分页PDF的路径fp_read_file = open(read_file, 'rb')pdf_input = PdfFileReader(fp_read_file)  # 将要分割的PDF内容格式话page_count = pdf_input.getNumPages()  # 获取PDF页数print("该文件共有{}页".format(page_count))  # 打印页数out_detail=r"C:\Users\71694\Desktop\1.txt" #  分页之后命名文件with open(out_detail, 'r',True,'utf-8')as fp:# print(fp)txt = fp.readlines()# print(txt)for detail in txt:  # 打开分割标准文件# print(type(detail))pages, write_file = detail.split()  # 空格分组#  write_file, write_ext = os.path.splitext(write_file)  # 用于返回文件名和扩展名元组pdf_file = f'{write_file}.pdf'# liststr=list(map(int, pages.split('-')))# print(type(liststr))start_page, end_page = list(map(int, pages.split('-')))  # 将字符串数组转换成整形数组start_page -= 1try:print(f'开始分割{start_page}页-{end_page}页,保存为{pdf_file}......')pdf_output = PdfFileWriter()  # 实例一个 PDF文件编写器for i in range(start_page, end_page):pdf_output.addPage(pdf_input.getPage(i))with open(pdf_file, 'wb') as sub_fp:pdf_output.write(sub_fp)print(f'完成分割{start_page}页-{end_page}页,保存为{pdf_file}!')except IndexError:print(f'分割页数超过了PDF的页数')# fp.close()except Exception as e:print(e)if __name__ == '__main__':split_pdf()

命名文件1.txt格式

1-1 test [第一页到第一页分页为test.pdf]

1-1 test
2-2 test2
3-3 test3

python分页PDF相关推荐

  1. 手把手教你如何用Python从PDF文件中导出数据(附链接)

    作者:Mike Driscoll :翻译:季洋:校对:丁楠雅 本文约4000字,建议阅读10分钟. 本文介绍了在提取出想要的数据之后,如何将数据导出成其他格式的方法. 有很多时候你会想用Python从 ...

  2. Python 读pdf数据写入Excel表中

    ​ ​ 活动地址:CSDN21天学习挑战赛 目录 一.Python操作PDF的库有很多 二.pdflumber作为案例讲解使用 2.安装配置 2.加载PDF 3.读取pdf文档信息 1)读取pdf文档 ...

  3. 8、【办公自动化】Python实现PDF文件的批量操作

    说明 平时工作中,经常会和 PDF 文件打交道,比如,合并.拆分.加解密.添加和去除水印.提取指定内容.转换成其他文件格式等操作.如果只是处理单个 PDF 文件的话,有些操作是比较简单的,而如果需要批 ...

  4. Python自动化办公系列之Python操作PDF

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 输 作者介绍: 大家可以叫我黄同学(博客名:Huang Supre ...

  5. python怎么玩pdf_最全总结!聊聊 python 操作PDF的几种方法

    作者:陈熹 来源:早起Python 一.前言 大家好,有关Python操作PDF的案例之前已经写过一个PDF批量合并,这个案例初衷只是给大家提供一个便利的脚本,并没有太多讲解原理,其中涉及的就是PDF ...

  6. python pdf-浅谈Python处理PDF的方法

    处理pdf文档 第一. 从文本中提取文本 第二. 创建PDF 两种方法 #使用PdfFileWriter import PyPDF2 pdfFiles = [] for filename in os. ...

  7. 疯狂python讲义视频 百度云-疯狂Python讲义 PDF高清版附源码

    内容简介 本书全面,深入地介绍了Python编程的相关内容,大致可分为四个部分.*系统部分介绍了Python的基本语法结构,函数编程,类和对象,模块和包,异常处理等: 第二部分主要介绍Python常用 ...

  8. python csv转excel_使用 Python 把 PDF 转为 CSV 和 Excel(一)

    杭州国立公证处-公正摇号 会不定期公布杭州各个楼盘的购房意向登记汇总表和摇号结果,里面公开的数据是很全面的,对于想要分析一波数据搞点事情的人来说,挺有吸引力的. 但当你兴冲冲地去官网下载完数据,一看傻 ...

  9. Python处理PDF与CDF

    在拿到数据后,最需要做的工作之一就是查看一下自己的数据分布情况.而针对数据的分布,又包括pdf和cdf两类. 下面介绍使用python生成pdf的方法: 使用matplotlib的画图接口hist() ...

  10. python读取pdf表格_【Python 库】解析PDF文本及表格——pdfminer、tabula、pdfplumber 的用法及对比...

    pdf 是个异常坑爹的东西,有很多处理 pdf 的库,但是没有完美的. 一.pdfminer3k pdfminer3k 是 pdfminer 的 python3 版本,主要用于读取 pdf 中的文本. ...

最新文章

  1. ubuntu下启动和关闭tomcat的简单方法
  2. CoreOS的Tectonic新发行版支持Kubernetes自我管理
  3. 串口初始化结构体和固件库讲解
  4. 广义线性模型——逻辑回归(logistic regression)
  5. 银联无卡涉及关键词整理
  6. 计算机信息技术知识点思维导图,思维导图信息技术的学习方法
  7. Emmagee——开源Android性能测试工具
  8. linux怎么看本机ip,linux下查看本机IP的两种方法
  9. 训练误差和泛化误差、K折交叉验证
  10. Altium Designer 总结
  11. 【渝粤教育】电大中专Windows操作系统_1作业 题库
  12. vue 创建一个 表格,横向纵向都可以增加(减少)行和列,并且内容内容可以输入,标题可以修改
  13. 【WebAPI 验证】给 webapi加上token 验证(包括上传文件方法)
  14. c# 计算圆锥的体积_用C#如何编写程序计算球,圆柱和圆锥的表面积和体积?
  15. 当我们说“嘿,siri”时,会发生什么?
  16. mysql云化方案_云原生下,如何实现高可用的MySQL?
  17. 好多人一个月3000块钱工资怎么维持生活的?
  18. LX弹幕wss弹幕RPC
  19. linux串口卡驱动下载,ch350l驱动
  20. GDUT 排位赛2.19 D

热门文章

  1. 常用的SEO工具都有哪些呢?5个SEO必备优化工具推荐
  2. 怎么更改计算机的注册表,Windows如何一键修改注册表
  3. 计算机通过注册表修改摄像机设备的名称
  4. 转载:用图片搜索图片的几个好网站
  5. 软件概要设计文档编写
  6. 2018北京java面试心得体会(一年经验)
  7. PHP发卡自动源码,PHP自动化售货发卡网源码
  8. 项目管理:系统需求分析模板
  9. 第一本微服务网关图书上市,详解 GitHub 28.3k+ 标星项目 Kong
  10. 在 Windows XP Embedded 中使用 Enhanced Write Filter (EWF)[微软影子系统]