处理pdf文档

第一、

从文本中提取文本

第二、

创建PDF

两种方法

#使用PdfFileWriter

import PyPDF2

pdfFiles = []

for filename in os.listdir('.'):

if filename.endswith('.pdf'):

pdfFiles.append(filename)

print(pdfFiles)

pdfWriter = PyPDF2.PdfFileWriter()

pdfFileObj = open(pdfFiles[0],'rb')

pdfReader = PyPDF2.PdfFileReader(pdfFileObj) # 得到PdfFileReader对象

first,end =map(int,input('从多少页到多少页(用空格隔开):').split())

for pageNum in range(first-1,end):

pageObj = pdfReader.getPage(pageNum)

pdfWriter.addPage(pageObj)

pdfOutput = open ('split_pdf.pdf','wb')

pdfWriter.write(pdfOutput)

pdfOutput.close()

#使用PdfFileMerger()

import PyPDF2

merger = PyPDF2.PdfFileMerger()

a = [str(i)+'webbook.pdf'for i in range(0,124)]

for i in a:

print(i)

merger.append(open(i,'rb'))

print("合并完成第"+str(i))

with open('combintion.pdf','wb') as f:

merger.write(f)

总结

以上就是本文关于浅谈Python处理PDF的全部内容,希望对大家有所帮助。感兴趣的朋友可以继续参阅本站:python先序遍历二叉树问题、python实现人脸识别代码、python执行使用shell命令方法分享等,有什么问题可以随时留言,小编会及时回复大家的。感谢朋友们对本站的支持!

python pdf-浅谈Python处理PDF的方法相关推荐

  1. python bokeh_浅谈python可视化包Bokeh

    本文研究的主要是python可视化包Bokeh的相关内容,具体如下. 问题:需要把pandas的数据绘图并通过网页显示,matplotlib需要先保存图像,不合适. 解决:在网上搜了一下,找到一篇介绍 ...

  2. Python实例浅谈--Python与C/C++相互调用

    转载链接:Python实例浅谈之三Python与C/C++相互调用_乌托邦2号的博客-CSDN博客_python 调用c++类 目录 一.问题 二.Python调用C/C++ 1.Python调用C动 ...

  3. 精通python设计模式-浅谈Python设计模式 - 原型模式

    声明,本系列文章主要参考<精通Python设计模式>一书,并且参考一些资料,结合自己的一些看法来总结而来. 在<精通Python设计模式>中把设计模式分为三种类型: 创建型模式 ...

  4. python语句-浅谈 Python 的 with 语句

    引言 with 语句是从 Python 2.5 开始引入的一种与异常处理相关的功能(2.5 版本中要通过 from future import with_statement 导入后才可以使用),从 2 ...

  5. 翻译pdf中的英文 python_浅谈python实现Google翻译PDF,解决换行的问题

    我们复制PDF到Google翻译时,总是会出现换行的情况,如果自己手动去除,那就太麻烦了. 那么用Python就可以解决,复制到粘贴板以后,Python程序自动可以把\n换成空格,然后我们就可以复制到 ...

  6. python中内置的四种数值类型为_浅谈python语言四种数值类型

    Python语言支持四种不同的数值类型,包括int(整数)long(长整数)float(浮点实际值)complex (复数),本文章向码农介绍python 四种数值类型,需要的朋友可以参考一下.希望对 ...

  7. python sys模块作用_浅谈Python中的模块

    模块 为了编写可维护的代码,我们把很多函数分组,分别放到不同的文件里,这样,每个文件包含的代码就相对较少,很多编程语言都采用这种组织代码的方式.在Python中,一个.py文件就称之为一个模块(Mod ...

  8. python中文字符串编码_浅谈python下含中文字符串正则表达式的编码问题

    前言 Python文件默认的编码格式是ascii ,无法识别汉字,因为ascii码中没有中文. 所以py文件中要写中文字符时,一般在开头加 # -*- coding: utf-8 -*- 或者 #co ...

  9. python老是报参数未定义_浅谈Python程序的错误:变量未定义

    Python程序的错误种类 Python程序的错误分两种.一种是语法错误(syntax error).这种错误是语句的书写不符合Python语言的语法规定.第二种是逻辑错误(logic error). ...

  10. Python实例浅谈之三Python与C/C++相互调用

    参考:http://blog.csdn.net/taiyang1987912/article/details/44779719 Python实例浅谈之三Python与C/C++相互调用 二.Pytho ...

最新文章

  1. 在RHEL4上安装ORACLE9.2.04
  2. oracle db_files,如何解决 Oracle 中 DB_FILES 限制引起的 ORA-00059 问题
  3. OneNote代码高亮插件(NoteHighLight)
  4. HDU - 5790 Prefix(主席树+字典树)
  5. mysql set 常用参数_mysql常见配置参数
  6. 按英语体育计算机创建透视表,数据透视表和数据透视图概述
  7. Redis数据安全与性能保障——redis读书笔记4
  8. 【汇编优化】之X86汇编优化
  9. 奇安信代码安全实验室帮助微软修复两个 “重要” 漏洞,获官方致谢
  10. 《linux核心应用命令速查》连载十二:top:显示进程
  11. easyui combobox根据输入内容动态查找_制作智能下拉菜单,自动筛选想要输入的数据,同事都看呆了...
  12. IDEA中如何使用debug调试项目 一步一步详细教程
  13. Spring源码下载编译阅读
  14. 计算机一级考试 文字录入,计算机一年级《文字录入》期末考试题(理论)B
  15. 关于Linux下ISE和vivado安装cable usb驱动的问题
  16. 中国第一程序员求伯君,WPS之父,雷军也佩服的人
  17. java两数相乘的函数_jquery 加法 乘法运算 精确计算函数
  18. python中sklearn.datasets.make_blobs()函数用法
  19. 华为手机设置页面黑色_华为手机简单设置一下,来电直接显示对方照片视频,个性又炫酷...
  20. Eclipse各版本代号一览表以及官网上有很多版本的eclipse,下载哪个版本比较合适呢?

热门文章

  1. python3 aes 解密
  2. java maven compiler设置默认1.8
  3. centos修改SSH端口并禁用root远程登录
  4. 写了一个栈和多线程栈,修补上次的数据结构的栈的知识
  5. 转帖:iOS UIWindow UIWindowLevel
  6. ASP.NET 快乐建站系列 -- 1. 十五分钟建立精美网站
  7. cascade inverse (2010-01-12)
  8. Asp.net Mvc Codeplex Preview 5 第三篇 实现Action参数传递繁杂类型 【转】
  9. [导入]XML for Analysis(XMLA)开发详解-(3)各版本的SQL Server及Windows下配置XMLA over HTTP访问SASS(OLAP)的文档合集...
  10. 获取某个日期的当前周一的时间