Python将PDF按页转换为图片


文章目录

  • Python将PDF按页转换为图片
  • 前言
  • 一、使用的工具库
  • 二、实现代码
    • 1.引入库
  • 总结

前言

有时我们需要将PDF转换为图片做一些处理,一部分PDF阅读器例如Acrobat具备类似的功能,但是软件不同版本的功能有一定的差异,使用Python处理各类文件更加方便。


一、使用的工具库

本次主要使用的有两个库,PyPDF2和fitz,这两个库都具有对PDF文件进行编辑处理的功能。
PyPDF2是专门对PDF文件进行操作的工具库,包含多种功能。
fitz是轻量级的PDF,XPS,电子书阅读器,可以对PDF文件编辑,也可以访问多种格式的文件。

二、实现代码

1.引入库

首先引用需要使用两个工具库

import fitz
import PyPDF2

下面读取需要转换的PDF文件,使用PyPDF2获取PDF文件的页数

pdf = "abc.pdf"
doc = fitz.open("abc.pdf")
reader = PyPDF2.PdfFileReader(pdf)
# 获取单个文件页数
pageNum = reader.getNumPages()

分别读取每一页PDF内容,将PDF内容保存为PNG格式的图片,使用对应的页码对图片进行保存

for pg in range(0,pageNum):page = doc.load_page(pg)pix = page.get_pixmap()a = str(pg)b = 'C:\\Users\\bbb\\Desktop\\新建文件夹\\img\\'c = ".png"pix.save(b+a+c)

运行后即可在指定目录下得到保存的图片文件。


总结

本次分享了使用Python将PDF转换为图片的方法,通过multiprocess等工具库可以批量处理PDF文件,进一步提高效率。

Python将PDF按页转换为图片相关推荐

  1. java pdf转图片拼接_java实现pdf按页转换为图片

    本文实例为大家分享了java实现pdf按页转换为图片的具体代码,供大家参考,具体内容如下 本程序是利用jacob.jar包实现的,关于jacob.jar的配置见我上一篇文章,程序中可配置参数选择图片清 ...

  2. java pdf 多页转换为png格式的图片

    java pdf 多页转换为png格式的图片  适用于 无论pdf有多少页均可 废话不说,直接上代码 import java.awt.Graphics; import java.awt.image.B ...

  3. PDF文档转换为图片、图片转成PDF 及PDF合并

    简介 功能:PDF文档按每页转换成一张图片,一张图片转换成一张PDF 并将多张PDF合成一个多页的PDF文档. 经历:在各个网站上搜索始终出现各种问题,尤其是遇到引用的版本问题尤其头疼,不是不能适用当 ...

  4. 如何将Word文档每页转换为图片保存?

    我们在日常的工作和学习中,将Word文档的每一页转换为图片似乎并不多见,但是如果遇到需要这种操作时似乎会难到很到人,因为Word文档不具有直接保存为图片形式的功能.有时候我们需要将每一页的Word文档 ...

  5. windows下用Python把pdf文件转化为图片(png高清)

    windows下python3实现PDF转png图片,高清!!!希望可以帮到大家 windows下用Python将pdf文件转化为图片(png高清) 不扯没用的,直接上代码 1.环境:windows( ...

  6. python处理pdf实例_Python程序图片和pdf上文字识别实例

    实例一:先减少背景杂音,再做图片文字识别 为了提高识别率,先用opencv-python对扫描的图片做预处理(减少背景杂音),然后调用pytesseract识别图片上的文字.处理方式就是: 学习Pyt ...

  7. 利用 Python 去除 PDF 水印(和图片水印原理一样)

    前言 今天介绍下用 Python 去除 PDF (图片)的水印.思路很简单,代码也很简洁. 首先来考虑 Python 如何去除图片的水印,然后再将思路复用到 PDF 上面. 原理 这张图片是前几天整理 ...

  8. PDF文件怎么转换为图片?

    PDF转图片,你还在直接截图保存吗?如果你试过,你就会发现分辨率受到了很大的影响,那PDF文件如何转换成JPG或PNG?今天给大家推荐一款移动端很好用的PDF工具"金闪PDF",可 ...

  9. python将pdf文件类型转换为txt、docx、excel

    利用python的pdfplumber库可以实现转换,一些常用的方法 .extract_text() 用来提页面中的文本,将页面的所有字符对象整理为的那个字符串 .extract_words() 返回 ...

  10. 使用python将pdf转化为长图片

    源文章:PDF转图片再转长图.python.pil_qq_41256425的博客-CSDN博客_pdf转长图 python 之所以发这个是因为源文章中的库升级以后这个代码没法跑了,所以更新了新的代码: ...

最新文章

  1. 浏览器常见兼容性问题汇总
  2. 原生Android之(6.0及以上)权限申请
  3. java.lang中String类源码分析
  4. java和netbeans区别_如果我想只使用Java中的Eclipse和Netbeans有什么区别?
  5. 编写你的第一个垃圾收集器
  6. *和**在Python中意味着什么?它与指针和地址有关吗?
  7. OpenVINO InferenceEngine framework
  8. androidpn 推送初探
  9. 数据库概述之数据库设计实例分析
  10. 【python数据分析】亚太地区的商学院(商务与经济统计案例3-3)数据分析
  11. 智能马桶盖FCC认证 家电检测认证标准及要求
  12. 电脑录屏的html文件,如何在电脑录制网页视频及网页录音?
  13. 求正方形和长方形的个数
  14. win7从光盘进入修复计算机,深度完美正式版win7系统修复工具自修复崩溃系统
  15. 一个题目引发的数组和指针复习
  16. 现代网络负载均衡和代理技术
  17. 联想服务器重装系统u盘启动不了怎么办,联想thinkpad无法进入u盘启动怎么办?
  18. DedeCMS帝国备份王织梦系统网站搬家
  19. 传圣火~~~递友情~~~~NAONAO是博客火炬手~~~
  20. 我看过《隐秘的角落》才知道,理科生有多可怕!

热门文章

  1. 写DM9000网卡芯片驱动的预备知识
  2. 深海迷航代码_《深海迷航(Subnautica)》入坑指南
  3. C# Abp框架入门系列文章(一)
  4. python 多行注释后可运行程序报错
  5. vue面试题+答案,2021前端面试
  6. 矩阵L2,1范数及矩阵L2,p范数的求导
  7. BOM物料管理在PLM系统中的应用
  8. 2021年软件测试工具总结——接口测试工具
  9. 小米游戏本bios更新_小米笔记本 Pro 15.6 独显MX150 版本升级BIOS.2019年1月7日.2020年5月8日补充结果.完本!...
  10. MLCC电容的直流偏压特性 贴片电容