在阅读PDF文档时,个人习惯在笔记本上双页阅读,但有的PDF边距太宽,看起来字很小,阅读吃力

本代码用来裁剪整个PDF文档间距

import PyPDF2
import osleft_margin = right_margin = 30
top_margin = 5
bottom_margin = 5input_file_path = []
output_file_path = []
os.makedirs('.\\修改')  # 新建文件夹file_path = '.\\'
file_list = os.listdir(file_path)
for i in file_list:if os.path.splitext(i)[1] == '.pdf':input_file_path.append('.\\' + i)output_file_path.append('.\\修改\\' + '修改' + i)def split(page):page.mediaBox.lowerLeft = (left_margin, bottom_margin)page.mediaBox.lowerRight = (width - right_margin, bottom_margin)page.mediaBox.upperLeft = (left_margin, height - top_margin)page.mediaBox.upperRight = (width - right_margin, height - top_margin)for m in range(len(input_file_path)):input_file = PyPDF2.PdfFileReader(open(input_file_path[m], 'rb'))output_file = PyPDF2.PdfFileWriter()page_info = input_file.getPage(0)width = float(page_info.mediaBox.getWidth())height = float(page_info.mediaBox.getHeight())page_count = input_file.getNumPages()for page_num in range(page_count):this_page = input_file.getPage(page_num)split(this_page)output_file.addPage(this_page)output_file.write(open(output_file_path[m], 'wb'))

使用之前

使用之后

用python裁剪PDF文档相关推荐

  1. 【Python】PDF文档导出指定章节为TXT

    PDF文档导出指定章节为TXT 需求 要导出3000多个pdf文档的特定章节内容为txt格式(pdf文字可复制). 解决 导出PDF 查了一下Python操作PDF文档的方法,主要是通过3个库,PyP ...

  2. 教你如何使用 Python 将 pdf 文档进行 加密 解密——python实用小技能分享

      上次说了怎么将word转换为pdf格式 及 实现批量将word转换为pdf格式(点击这里),这次我又get到一个新技能–使用 Python 将 pdf 文档进行 加密 解密,哈哈哈 希望帮到更多人 ...

  3. 数据导入与预处理-第4章-数据获取python读取pdf文档

    数据导入与预处理-第4章-数据获取Python读取PDF文档 1 PDF简介 1.1 pdf是什么 2 Python操作PDF 2.1 pdfplumber库 2.2 pdfplumber基本操作 2 ...

  4. Python读取PDF文档(或TXT)

    字符串在Python内部的表示是Unicode编码,首先我们来认识Python中encode()和decode()的作用与区别: 在做编码转换时,通常需要以unicode作为中间编码,即先将其他编码的 ...

  5. 用HiPDF工具怎么裁剪PDF文档

    PDF文档可以使用裁剪的方式,来去掉一些不必要的内容,使得文档更加简洁明了.无论是为了更好的阅读体验,还是为了减小文件的大小,都可以通过剪裁PDF页面来实现,那么在如何快速裁剪PDF文档呢?有什么好用 ...

  6. python书籍pdf文档密码-Python玩转PDF的各种骚操作

    Portable Document Format(可移植文档格式),或者PDF是一种文件格式,可以用于跨操作系统的呈现和文档交换.尽管PDF最初是由Adobe发明的,但它现在是由国际标准化组织(ISO ...

  7. python分割pdf文档

    python -V 3.7 需求 需要将一个pdf文档分割成一页一页的pdf 代码 可以使用PyPDF2库 from PyPDF2 import PdfFileReader, PdfFileWrite ...

  8. python pdf处理工具_用Python处理pdf文档

    介绍 译者翻译了很多Python强大的包,其中,一以贯之的思想是:面向对象.我用下面的翻译来举一个例子,比如:从PyPDF2包中导入PdfFileReader包.PdfFileReader是此包的一个 ...

  9. python搜索pdf内容所在页码_利用Python在pdf文档中寻找某些词出现的页码

    要研究pdf文件的页码,首先要考虑这个文件的种类.pdf可能是一本书的电子版,可能是一份简历.可能是由Word.PPT或其他文档导出的--如果不是一本书,通常页面内容里是没有页码的:如果是一本书,虽然 ...

  10. 如何使用Python将PDF文档转为MP3音频

    老许小课堂开课了 一.转语音工具 微信读书里的电子书有配套的自动音频,而且声音优化的不错,比传统的机械朗读听起来舒服很多. 记得之前看到过Python有一个工具包,可以将文字转换为语音,支持英文和中文 ...

最新文章

  1. android 代码设置inputtype,android – 如何正确设置EditText的InputType?
  2. 如何用Powerdesigner的PDM(物理数据模型)生成数据库及逆向工程(将现有的数据库生成PDM)(转)...
  3. saturate_cast<uchar>(int v)的作用
  4. linux 禁止账户远程登录
  5. Opencv--获取Mat图像数据的方式
  6. 检查数组中的子字符串– Java,Python和Swift
  7. Java基础~Java ASCII码的转换
  8. 西部数据硬盘不同色彩的含义
  9. python播放全网视频+打包成exe
  10. 你的性格是什么颜色的?乐嘉《性格色彩学》测试题
  11. 微信文章数据 API数据接口
  12. 计算机网络小黑指北-单选题自测
  13. isis宣告网络_ISIS是一个分级的链接状态路由协议
  14. 12月6日云栖精选夜读:语音购票、刷脸进站:上海联手阿里打造全球首个AI地铁之城...
  15. 自己用js做的在线word文档编辑器oarword-doc/docx文档编辑、导出导出
  16. 2019,推荐几个牛逼大佬的公号
  17. freemarker遍历list处理第一个、最后一个元素
  18. 手机APP(功能)测试重点
  19. 复杂指令集(CISC)和精简指令集(RISC)
  20. python3 实现公众号自动发消息

热门文章

  1. ArduinoUNO实战-第六章-电位器实验
  2. 4针串口线接法图_串口硬盘4针的小接口怎么样连接
  3. 算法——最好理解的动态规划之01背包详解(看完这篇再不敢说自己不知道01背包算法!!!)
  4. 计算机键盘无法使用的原因,电脑键盘失灵的原因及解决方法
  5. 曲线的平滑和随机生成
  6. 计算机网络测速创新,一种计算机网络安全测速装置的制作方法
  7. android 根据颜色值修改背景图的背景色 最简单方法
  8. python绘图画猫咪_Turtle库画小猫咪
  9. 如何将b站视频从手机传输到电脑上
  10. Linus 没空实现的功能,开发者做到了:苹果 M1 Mac 成功运行原生 Linux!