#!/usr/bin/env python# coding=utf-8

from PyPDF2 import PdfFileReader, PdfFileWriter

# PDF文件分割def split_pdf(read_file, out_detail):    try:        fp_read_file = open(read_file, 'rb')        pdf_input = PdfFileReader(fp_read_file)  # 将要分割的PDF内容格式话        page_count = pdf_input.getNumPages()  # 获取PDF页数        print(page_count)  # 打印页数

        with open(out_detail, 'r',True,'utf-8')as fp:            # print(fp)            txt = fp.readlines()            # print(txt)            for detail in txt:  # 打开分割标准文件                # print(type(detail))                pages, write_file = detail.split()  # 空格分组               #  write_file, write_ext = os.path.splitext(write_file)  # 用于返回文件名和扩展名元组                pdf_file = f'{write_file}.pdf'                # liststr=list(map(int, pages.split('-')))                # print(type(liststr))                start_page, end_page = list(map(int, pages.split('-')))  # 将字符串数组转换成整形数组                start_page -= 1                try:                    print(f'开始分割{start_page}页-{end_page}页,保存为{pdf_file}......')                    pdf_output = PdfFileWriter()  # 实例一个 PDF文件编写器                    for i in range(start_page, end_page):                        pdf_output.addPage(pdf_input.getPage(i))                    with open(pdf_file, 'wb') as sub_fp:                        pdf_output.write(sub_fp)                    print(f'完成分割{start_page}页-{end_page}页,保存为{pdf_file}!')                except IndexError:                    print(f'分割页数超过了PDF的页数')        # fp.close()    except Exception as e:        print(e)    finally:        fp_read_file.close()

# def main():#     fire.Fire(split_pdf)## if __name__ == '__main__':#     main()

split_pdf('建龙微纳_银行流水_中国工商银行_2018_112页.pdf', '10_20_50.txt')

转载于:https://www.cnblogs.com/sunmoon1993/p/11021758.html

python分割PDF相关推荐

  1. python分割pdf文档

    python -V 3.7 需求 需要将一个pdf文档分割成一页一页的pdf 代码 可以使用PyPDF2库 from PyPDF2 import PdfFileReader, PdfFileWrite ...

  2. Python分割PDF页面

    1.安装第三方库pdf2 pip install pypdf2 -i https://pypi.tuna.tsinghua.edu.cn/simple (代码文件.要切割的PDF文件.以及分割的规则文 ...

  3. python3 PyPDF2分割pdf

    首先需要安装: pip install PyPDF2 批量切割 然后利用下面的代码: from PyPDF2 import PdfFileReader, PdfFileWriter# PDF文件分割 ...

  4. Python应用——自定义函数:分割PDF文件函数

    案例 将一个 pdf 文件按要求分割为几个部分.比如说一个pdf有20页,分成5个pdf文件,每个pdf文件包含4页.设计函数实现? Python代码 from PyPDF2 import PdfFi ...

  5. PyPDF2 | 利用 Python 实现 PDF 分割

    1. PDF 分割 由于疫情影响被迫在家上网课,因此教材也只能用电子版.但有一门教材是对开的扫描版,导致在 iPad 上阅读很不友好,因此决定寻找一个工具将 PDF 对半分开. 图1 分割前的 PDF ...

  6. python获取pdf页数_Python分割指定页数的pdf文件方法

    Python分割指定页数的pdf文件方法 如下所示: from PyPDF2 import PdfFileWriter, PdfFileReader # 开始页 start_page = 0 # 截止 ...

  7. python分割函数_Python应用——自定义函数:分割PDF文件函数

    案例 将一个 pdf 文件按要求分割为几个部分.比如说一个pdf有20页,分成5个pdf文件,每个pdf文件包含4页.设计函数实现? Python代码 from PyPDF2 import PdfFi ...

  8. python操作pdf做文档的分割、合并,内容提取

    Python 操作 PDF 会用的库:PyPDF2 和 pdfplumber PyPDF2 可以更好的读取.写入.分割.合并PDF文件: pdfplumber 可以更好的读取 PDF 文件中内容和提取 ...

  9. Python自动化办公系列之Python操作PDF

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 输 作者介绍: 大家可以叫我黄同学(博客名:Huang Supre ...

  10. 疯狂python讲义视频 百度云-疯狂Python讲义 PDF高清版附源码

    内容简介 本书全面,深入地介绍了Python编程的相关内容,大致可分为四个部分.*系统部分介绍了Python的基本语法结构,函数编程,类和对象,模块和包,异常处理等: 第二部分主要介绍Python常用 ...

最新文章

  1. mysql正斜杠_MySQL中的正斜杠和反斜杠 | | 数据库系统概论(字符匹配)
  2. 国外java开源网站聚合
  3. ios弧形进度条_ios 圆形进度条
  4. node --- 使用mongoose连接mongoDB,并初始化所有的Schema
  5. aspx转发php_asp,php,aspx一句话合集
  6. 剑指Offer(四):重建二叉树
  7. 关于私钥加密、公钥加密、签名在生活中的场景
  8. 支付宝蚂蚁森林入选2019年世界环境日实践案例
  9. PPG信号滤波过后的时频分析
  10. 在windows和Ubuntu配置OpenXXX客户端
  11. 【Linux】Centos设置Python的软链接
  12. C++11中,获取随机数的新方法default_random_engine
  13. 达内python培训评价
  14. 人工智能领域的会议和期刊
  15. 暴笑口误2007贺岁版出炉喽!!(转载)
  16. 图书管理器项目(参考答案)
  17. 医疗纠纷如何进行防范?医疗纠纷的处置?
  18. 福特sync恢复出厂设置_福特SYNC功能介绍
  19. arcgis空间分析工具集阐释
  20. 医疗器械标准目录 第一部分通用技术领域

热门文章

  1. python控制风扇_Python 语音控制普通风扇实现教程
  2. 金额转换,阿拉伯数字的金额转换成中国传统的形式
  3. C语言自定义函数使用
  4. C语言中函数的基本知识
  5. 背景知识:从熵(Entropy)到互信息(MI,Mutual Information)
  6. 高中数学:抛物线专题讲解利用韦达定理求解技巧
  7. 常用的红色的RGB值
  8. 微型计算机原理DL,微机原理试题
  9. 复合高斯求积matlab代码,谁有复何求积公式和高斯求积公式在matlab中实现的代码...
  10. SylixOS之OK6410开发板系统烧写