有时我们需要将PDF转换成图片,今天我们主要说的是pdf2image+poppler对PDF转换成图片格式。
pdf2image是个包装器,真正的转换工具是poppler
GitHub地址:https://github.com/Belval/pdf2image ,上面也有相关的配置说明。

1、安装pdf2image: pip install pdf2image
2、Windows安装配置poppler(这里只介绍Windows,Mac和Linux去上面Github地址里面参考官网)
Windows用户必须为Windows安装poppler,然后将bin/文件夹添加到PATH(开始>输入env>编辑系统环境变量>环境变量...>系统变量>Path)
Windows的poppler下载地址:http://blog.alivate.com.au/poppler-windows/

注意这里配置之后需要重启一下电脑才会生效,不然会报如下错误:

下面是具体代码:

convert_from_path()和convert_from_bytes()两个方法,具体参数介绍:


pdf_path --> 要转换的PDF文档路径
dpi -->DPI中的图像质量(默认为200),Windows默认为96dpi
output_folder --> 将生成的图像写入文件夹(而不是直接写入内存)若是path不做指定的话,path的默认地址是:C:\Users\pppp\AppData\Local\Temp\生成的uuid4。
first_page --> 从哪一页开始转换,默认是PDF的第一页
last_page -->转换到哪一页,默认是PDF的最后一页
fmt --> 输出图像格式默认格式是ppm,还可以设置为png和jpeg等
thread_count --> 允许生成多少个线程进行处理,一般不超过4个线程;
userpw --> PDF的密码(若有密码的话需要添加)
use_cropbox -->使用cropbox而不是mediabox
strict --> 参数允许您使用自定义类型PDFSyntaxError捕获pdftoppm语法错误
transparent --> 参数允许生成没有背景的图像,而不是通常的白色图像(为此需要pdftocairo)
single_file --> 使用pdftoppm / pdftocairo中的-singlefile选项
output_file --> 输出文件名是什么
poppler_path --> 查找poppler二进制文件的路径,允许用户使用poppler_path指定poppler的安装路径;默认不指定的话需要将bin添加到系统PATH

统计了3种方法的耗时(转换82页的PDF):

pdf1_to_image() 耗时 6~8秒   pdf2_to_image() 耗时 5~8秒  pdf3_to_image() 耗时 10~15秒 pdf4_to_image() 耗时 11~15秒

所以优先选择pdf1_to_image()

另外还有一个模块也可以将pdf转换为图片格式PyMuPDF

【Python】pdf2image模块+poppler将PDF转换为图片相关推荐

  1. 【Python】PyMuPDF模块将PDF转换为图片

    上一篇文章介绍了pdf2image模块+poppler将PDF转换为图片,这篇文章主要介绍另外一个模块PyMuPDF.  PyMuPDF(又名"fitz"):MuPDF的Pytho ...

  2. Python 利用pymupdf将pdf转换为图片并拆分,后通过PIL合并生成一张图片

    文章主要内容主要参考几篇文章并合并在一起的,文章链接依次如下,第二和第三的文章链接是从第一篇文章找到的: (1).https://blog.csdn.net/qq_25115281/article/d ...

  3. 实现DOC、DOCX转换为PDF 再将PDF转换为图片

    实现DOC.DOCX转换为PDF 再将PDF转换为图片 首先导入需要的依赖 <dependency><groupId>cn.hutool</groupId>< ...

  4. 通过Python的pdfplumber库将pdf转为图片

    文章目录 前言 一.pdfplumber库是什么? 二.安装pdfplumber库 三.查看pdfplumber库版本 四.pdf素材 五.将pdf转为图片 1.引入库 2.定义pdf路径 3.打开P ...

  5. 快速将PDF转换为图片:免费的在线PDF转换器

    在现代数字时代,PDF是一种非常常见的文件格式.它们在学术界,商业领域和许多其他领域中被广泛使用.有时,您可能需要将PDF文件转换为图像格式,以便能够方便地与他人共享和使用.在这种情况下,您可以使用免 ...

  6. Ubuntu下Java使用pdfbox将pdf转换为图片的方法及问题

    Ubuntu下Java使用pdfbox将pdf转换为图片的方法及问题 使用pdfbox-2.0.3和fontbox-2.0.3,实现pdf转图片功能. 官方手册链接: http://pdfbox.ap ...

  7. 文字PDF转换为图片格式的PDF

    在我们的日常工作和生活中,有时候我们需要对PDF文件进行一些特殊处理.有时候,我们希望将PDF的每一页提取出来作为图片,方便在其他场景中使用:而有时候,我们则需要将PDF内的内容转换为图片格式,以防止 ...

  8. 如何将pdf转换为图片?

    其实在PDF的使用过程中,将PDF转换为不同的文件格式是很常规的一个操作,比如有时为了方便使用,我们就会选择将PDF转换成图片格式,这样我们可以任选我们需要的内容进行使用了,比起不停的翻阅整个pdf文 ...

  9. java+icepdf+下载,Java中使用icepdf轻松把pdf转换为图片

    Java中使用icepdf轻松把pdf转换为图片 icepdf简介: icepdf是java的一个专门处理pdf的外置的扩展包,使用它可以方便的把pdf转换为图片,当然它的功能不止如此,大家如果想要深 ...

最新文章

  1. 垃圾回收器机制(一):对象存活及强,弱等各种引用辨析
  2. oracle中变量前加冒号_ORACLE 变量的定义和使用
  3. python可迭代对象,迭代器,生成器
  4. 【JAVA】学习java 运行环境配置
  5. 截图软件:TechSmith SnagIt V10.0.0.788英文原版+有效激活码
  6. EOJ 1864 二分图匹配
  7. 关于TR1900错误的一些解决方法(引用冯哥)
  8. php云打印类,PHP应用:PHP云打印类完整示例
  9. 【吊打面试官系列】APP测试常见面试题解析
  10. 高颜值!广西730分学霸杨晨煜被清华智班录取,学习人工智能,网友纷纷求开微博!
  11. js原生常用知识点总结
  12. [附源码]Nodejs计算机毕业设计基于JAVA的校园电车租赁系统Express(程序+LW)
  13. C语言中fclose函数
  14. 谭浩强C++ 第四章
  15. 求1900到2017的闰年天数
  16. 使用Tencent Lemon卸载顽固软件
  17. BNUOJ-4716题 IQ test
  18. 关于 sql sever 2012 SQL Server Management Studio 遇到问题需要关闭
  19. SuperMap GIS发布三维服务流程
  20. 计算机换了显卡还是打不开,win7电脑配置可交换显卡为何打不开?打开显卡处理操作教程...

热门文章

  1. sqlite3修改表内容python_Python sqlite3数据库模块使用攻略
  2. composer 设置版本号_Composer依赖管理 – PHP的利器
  3. 北大青鸟消防控制器组网_北大青鸟JBF-61S20防火门监控器控制器接线示意图
  4. Android JNI Attempt to remove non-JNI local reference, dumping thread
  5. JVM006_类加载的过程
  6. python 列表、元组、集合、字典、循环遍历数据结构
  7. (二叉树的遍历)Tree UVa 548
  8. 二维数组vector的代码使用简单例子_vector容器_ 用构造函数vectorint()
  9. python 电脑显示桌面_使用Python快速实现显示器关闭和锁住桌面
  10. easyexcel设置下拉选项不能覆盖_Wi-Fi经常掉线 这个设置要修改