需求

将pdf的第一页即为封面转为图片。
所有pdf在同一个目录下,
生成的图片在同目录下的img文件夹内。
图片命名即为pdf的名字。

使用

安装以下第三方库:PyPDF2,pdf2image
同时下载poppler,下载地址是:
https://download.csdn.net/download/zhuan_long/85345825
解压压缩包,将poppler/bin/ 目录添加至电脑的path的环境变量里。

实现代码

from PyPDF2 import PdfFileReader, PdfFileWriter
import glob
import os
from pdf2image import convert_from_path
import shutildef pdf2image2(pdfPath, imagePath):images = convert_from_path(pdfPath, dpi=96)for image in images:if not os.path.exists(imagePath):os.makedirs(imagePath)pngname=pdfPath[6:-4]image.save(imagePath+'/'+pngname+'.png', 'PNG')def process_bar(no, total_length):bar = '\r' + str(no) + '|' + str(total_length)print(bar, end='', flush=True)def split_combine(path, pdf_writer):pdf = PdfFileReader(path, strict=False)# lastest pagepage = pdf.getPage(0)pdf_writer.addPage(page)
def run():# get curren dir pdf filespdf_list = glob.glob('*.pdf')pdf_writer = PdfFileWriter()imgpath="./img/"tmppath="./tmp/"if not os.path.exists(imgpath):os.makedirs(imgpath)if not os.path.exists(tmppath):os.makedirs(tmppath)for i, pdf_file in enumerate(pdf_list):process_bar(i + 1, len(pdf_list))split_combine(pdf_file, pdf_writer)with open(tmppath+pdf_file, 'wb') as output_pdf:pdf_writer.write(output_pdf)pdf2image2(tmppath+pdf_file, imgpath)# 递归删除文件夹,不需要的话注释shutil.rmtree(tmppath)if __name__ == '__main__':run()

Python将PDF转换为图片相关推荐

  1. 【Python】PyMuPDF模块将PDF转换为图片

    上一篇文章介绍了pdf2image模块+poppler将PDF转换为图片,这篇文章主要介绍另外一个模块PyMuPDF.  PyMuPDF(又名"fitz"):MuPDF的Pytho ...

  2. 【Python】pdf2image模块+poppler将PDF转换为图片

    有时我们需要将PDF转换成图片,今天我们主要说的是pdf2image+poppler对PDF转换成图片格式. pdf2image是个包装器,真正的转换工具是poppler GitHub地址:https ...

  3. Python 利用pymupdf将pdf转换为图片并拆分,后通过PIL合并生成一张图片

    文章主要内容主要参考几篇文章并合并在一起的,文章链接依次如下,第二和第三的文章链接是从第一篇文章找到的: (1).https://blog.csdn.net/qq_25115281/article/d ...

  4. 快速将PDF转换为图片:免费的在线PDF转换器

    在现代数字时代,PDF是一种非常常见的文件格式.它们在学术界,商业领域和许多其他领域中被广泛使用.有时,您可能需要将PDF文件转换为图像格式,以便能够方便地与他人共享和使用.在这种情况下,您可以使用免 ...

  5. 实现DOC、DOCX转换为PDF 再将PDF转换为图片

    实现DOC.DOCX转换为PDF 再将PDF转换为图片 首先导入需要的依赖 <dependency><groupId>cn.hutool</groupId>< ...

  6. Word处理控件Aspose.Words功能演示:在 Python 中将 PDF 转换为 JPG

    PDF文件以文档.发票.收据.文章等形式随处可见.它是打印和共享文档最方便的格式之一.在某些情况下,您必须将 PDF 文件转换为JPG图像以生成缩略图或嵌入到您的前端应用程序中.为此,本文介绍了如何在 ...

  7. Ubuntu下Java使用pdfbox将pdf转换为图片的方法及问题

    Ubuntu下Java使用pdfbox将pdf转换为图片的方法及问题 使用pdfbox-2.0.3和fontbox-2.0.3,实现pdf转图片功能. 官方手册链接: http://pdfbox.ap ...

  8. 文字PDF转换为图片格式的PDF

    在我们的日常工作和生活中,有时候我们需要对PDF文件进行一些特殊处理.有时候,我们希望将PDF的每一页提取出来作为图片,方便在其他场景中使用:而有时候,我们则需要将PDF内的内容转换为图片格式,以防止 ...

  9. 如何将pdf转换为图片?

    其实在PDF的使用过程中,将PDF转换为不同的文件格式是很常规的一个操作,比如有时为了方便使用,我们就会选择将PDF转换成图片格式,这样我们可以任选我们需要的内容进行使用了,比起不停的翻阅整个pdf文 ...

  10. java+icepdf+下载,Java中使用icepdf轻松把pdf转换为图片

    Java中使用icepdf轻松把pdf转换为图片 icepdf简介: icepdf是java的一个专门处理pdf的外置的扩展包,使用它可以方便的把pdf转换为图片,当然它的功能不止如此,大家如果想要深 ...

最新文章

  1. [导入]★ 你知道JavaScript里数组的最大长度允许多少吗 ★
  2. python3版本无法加载reload解决办法NameError: name 'reload' is not defined
  3. 2.2.2.进程调度的时机切换与过程、方式
  4. java ajax级联_jQuery ajax级联二级菜单(转)
  5. 都是打工的,为啥职场中存在着那么多勾引斗角?
  6. 外链检测工具,反链友链检测工具
  7. 组策略 禁止用户策略下发到指定计算机,使用组策略禁止域中计算机安装特定设备...
  8. 读书笔记_稻盛和夫《心》
  9. 爱代挂php源码,爱代挂外包,爱准挂外包,代挂系统218元秒搭建
  10. Android 上 NFC 应用
  11. 多彩的书写工具,画图写字更好看,米家液晶小黑板多彩版上手
  12. 013-zabbix trapper方式监控
  13. c语言对随机数进行快速排序,C语言快速排序与二分查找算法示例
  14. R语言使用lm函数构建多元回归模型(Multiple Linear Regression)、并根据模型系数写出回归方程、使用resid函数或者residuals计算出模型的残差值
  15. css3半圆弧线,css3实现画半圆弧线的示例代码
  16. win10下vs2013配置opencv2.4.11+测试代码
  17. MyEclipse安装:MyEclipse安装教程(包含视频教程)
  18. 不爱说话?社交无能?或许你可以试试这种说话术
  19. 计算机丢失UxTheme无法修复,win7系统丢失uxtheme.dll怎么办,win7电脑uxtheme.dll丢失的解决方法...
  20. 搜狗最新快速收录技巧

热门文章

  1. 华三服务器bios修改兼容模式,bios怎么设置兼容模式
  2. 凤凰网视频直播视频流
  3. 支付宝当面付_没有营业执照也能开支付宝当面付啦
  4. 小心 transmittable-thread-local 的这个坑
  5. Webpack打包警告: We noticed you're using the `useBuiltIns` option without declaring a core-js version.
  6. 基于JAVA的即时通信软件
  7. 腾讯课堂视频回放下载(Edge浏览器+猫抓+夸克浏览器)
  8. python 二项分布_Python模拟伯努利试验和二项分布代码实例
  9. NumPy 数组属性
  10. HttpClient(4.5) post get https 实例