python分割PDF
#!/usr/bin/env python# coding=utf-8 from PyPDF2 import PdfFileReader, PdfFileWriter # PDF文件分割def split_pdf(read_file, out_detail): try: fp_read_file = open(read_file, 'rb') pdf_input = PdfFileReader(fp_read_file) # 将要分割的PDF内容格式话 page_count = pdf_input.getNumPages() # 获取PDF页数 print(page_count) # 打印页数 with open(out_detail, 'r',True,'utf-8')as fp: # print(fp) txt = fp.readlines() # print(txt) for detail in txt: # 打开分割标准文件 # print(type(detail)) pages, write_file = detail.split() # 空格分组 # write_file, write_ext = os.path.splitext(write_file) # 用于返回文件名和扩展名元组 pdf_file = f'{write_file}.pdf' # liststr=list(map(int, pages.split('-'))) # print(type(liststr)) start_page, end_page = list(map(int, pages.split('-'))) # 将字符串数组转换成整形数组 start_page -= 1 try: print(f'开始分割{start_page}页-{end_page}页,保存为{pdf_file}......') pdf_output = PdfFileWriter() # 实例一个 PDF文件编写器 for i in range(start_page, end_page): pdf_output.addPage(pdf_input.getPage(i)) with open(pdf_file, 'wb') as sub_fp: pdf_output.write(sub_fp) print(f'完成分割{start_page}页-{end_page}页,保存为{pdf_file}!') except IndexError: print(f'分割页数超过了PDF的页数') # fp.close() except Exception as e: print(e) finally: fp_read_file.close() # def main():# fire.Fire(split_pdf)## if __name__ == '__main__':# main() split_pdf('建龙微纳_银行流水_中国工商银行_2018_112页.pdf', '10_20_50.txt')
转载于:https://www.cnblogs.com/sunmoon1993/p/11021758.html
python分割PDF相关推荐
- python分割pdf文档
python -V 3.7 需求 需要将一个pdf文档分割成一页一页的pdf 代码 可以使用PyPDF2库 from PyPDF2 import PdfFileReader, PdfFileWrite ...
- Python分割PDF页面
1.安装第三方库pdf2 pip install pypdf2 -i https://pypi.tuna.tsinghua.edu.cn/simple (代码文件.要切割的PDF文件.以及分割的规则文 ...
- python3 PyPDF2分割pdf
首先需要安装: pip install PyPDF2 批量切割 然后利用下面的代码: from PyPDF2 import PdfFileReader, PdfFileWriter# PDF文件分割 ...
- Python应用——自定义函数:分割PDF文件函数
案例 将一个 pdf 文件按要求分割为几个部分.比如说一个pdf有20页,分成5个pdf文件,每个pdf文件包含4页.设计函数实现? Python代码 from PyPDF2 import PdfFi ...
- PyPDF2 | 利用 Python 实现 PDF 分割
1. PDF 分割 由于疫情影响被迫在家上网课,因此教材也只能用电子版.但有一门教材是对开的扫描版,导致在 iPad 上阅读很不友好,因此决定寻找一个工具将 PDF 对半分开. 图1 分割前的 PDF ...
- python获取pdf页数_Python分割指定页数的pdf文件方法
Python分割指定页数的pdf文件方法 如下所示: from PyPDF2 import PdfFileWriter, PdfFileReader # 开始页 start_page = 0 # 截止 ...
- python分割函数_Python应用——自定义函数:分割PDF文件函数
案例 将一个 pdf 文件按要求分割为几个部分.比如说一个pdf有20页,分成5个pdf文件,每个pdf文件包含4页.设计函数实现? Python代码 from PyPDF2 import PdfFi ...
- python操作pdf做文档的分割、合并,内容提取
Python 操作 PDF 会用的库:PyPDF2 和 pdfplumber PyPDF2 可以更好的读取.写入.分割.合并PDF文件: pdfplumber 可以更好的读取 PDF 文件中内容和提取 ...
- Python自动化办公系列之Python操作PDF
点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 输 作者介绍: 大家可以叫我黄同学(博客名:Huang Supre ...
- 疯狂python讲义视频 百度云-疯狂Python讲义 PDF高清版附源码
内容简介 本书全面,深入地介绍了Python编程的相关内容,大致可分为四个部分.*系统部分介绍了Python的基本语法结构,函数编程,类和对象,模块和包,异常处理等: 第二部分主要介绍Python常用 ...
最新文章
- mysql正斜杠_MySQL中的正斜杠和反斜杠 | | 数据库系统概论(字符匹配)
- 国外java开源网站聚合
- ios弧形进度条_ios 圆形进度条
- node --- 使用mongoose连接mongoDB,并初始化所有的Schema
- aspx转发php_asp,php,aspx一句话合集
- 剑指Offer(四):重建二叉树
- 关于私钥加密、公钥加密、签名在生活中的场景
- 支付宝蚂蚁森林入选2019年世界环境日实践案例
- PPG信号滤波过后的时频分析
- 在windows和Ubuntu配置OpenXXX客户端
- 【Linux】Centos设置Python的软链接
- C++11中,获取随机数的新方法default_random_engine
- 达内python培训评价
- 人工智能领域的会议和期刊
- 暴笑口误2007贺岁版出炉喽!!(转载)
- 图书管理器项目(参考答案)
- 医疗纠纷如何进行防范?医疗纠纷的处置?
- 福特sync恢复出厂设置_福特SYNC功能介绍
- arcgis空间分析工具集阐释
- 医疗器械标准目录 第一部分通用技术领域