需求

将pdf的第一页即为封面转为图片。
所有pdf在同一个目录下,
生成的图片在同目录下的img文件夹内。
图片命名即为pdf的名字。

使用

pip install PyPDF2
pip install pdf2image

同时下载poppler,下载地址是:

https://blog.alivate.com.au/wp-content/uploads/2018/08/poppler-0.67.0_x86.7z
解压压缩包,将poppler/bin/ 目录添加至电脑的path的环境变量里。
注意一定要重启!否则没有生效

代码


from PyPDF2 import PdfFileReader, PdfFileWriter
import glob
import os
from pdf2image import convert_from_path
import shutildef pdf2image2(pdfPath, imagePath):images = convert_from_path(pdfPath, dpi=96)for image in images:if not os.path.exists(imagePath):os.makedirs(imagePath)pngname=pdfPath[6:-4]image.save(imagePath+'/'+pngname+'.png', 'PNG')def process_bar(no, total_length):bar = '\r' + str(no) + '|' + str(total_length)print(bar, end='', flush=True)def split_combine(path, pdf_writer):pdf = PdfFileReader(path, strict=False)# lastest pagepage = pdf.getPage(0)pdf_writer.addPage(page)if __name__ == '__main__':# get curren dir pdf filespdf_list = glob.glob('*.pdf')pdf_writer = PdfFileWriter()imgpath="./img/"tmppath="./tmp/"if not os.path.exists(imgpath):os.makedirs(imgpath)if not os.path.exists(tmppath):os.makedirs(tmppath)for i, pdf_file in enumerate(pdf_list):process_bar(i + 1, len(pdf_list))split_combine(pdf_file, pdf_writer)with open(tmppath+pdf_file, 'wb') as output_pdf:pdf_writer.write(output_pdf)pdf2image2(tmppath+pdf_file, imgpath)shutil.rmtree(tmppath)

python pdf转图片相关推荐

  1. python PDF 转 图片

    python PDF 转 图片 fitz库 代码 import fitz import time import re import os def pdf2image(pdf_path): '''# 从 ...

  2. python pdf 转 图片、pdf 转 word、 word 转 pdf

    python pdf 转 图片.pdf 转 word. word 转 pdf 文章目录 python pdf 转 图片.pdf 转 word. word 转 pdf 前言 一.环境 二.api文档 三 ...

  3. python pdf删除图片_【原创】python批量删除pdf图片水印(Xobject)的一种方法

    1.说明: 下载到的pdf总会有一些水印,pdf文件水印添加方式除了acrobat adobe自带的以外,还有很多,所以去除水印方法也很多,这里介绍的也只是一种适用python批量删除图片水印Xobj ...

  4. python pdf与图片互转

    背景 PDF转图片网上免费的只能转三次,多次的要么下载安装,要么收费.故自己写代码转换. 环境 1.安装python 2. 安装工具包 pip install PyMuPDF pip install ...

  5. python pdf和图片互转

    1.安装两个包 pip install PyMuPDF==1.18.17 PySimpleGUI==4.47.0 2.pdf转图片 import fitzdef pdf2img(pdf_path, i ...

  6. python pdf处理 图片_python PDF文件合并、图片处理

    一.合并多个PDF文件 实例: #导入模块import codecs import os import PyPDF2 as PyPDF2 #建立一个装pdf文件的数组 files = list()#遍 ...

  7. python pdf转图片 poppler_Python将PDF转成图片—PyMuPDF和pdf2image

    前言:在最近的测试中遇到一个与PDF相关的测试需求,其中有一个过程是将PDF转换成图片,然后对图片进行测试. 粗略的试了好几种方式,其中语言尝试了Python和Java,总体而言所找到的Python方 ...

  8. python pdf处理 图片_Python 将pdf转换成txt(不处理图片)

    上一篇文章中已经介绍了简单的python爬网页下载文档,但下载后的文档多为doc或pdf,对于数据处理仍然有很多限制,所以将doc/pdf转换成txt显得尤为重要.查找了很多资料,在linux下要将d ...

  9. python pdf处理 图片_在Python中从PDF提取图像而无需重新采样?

    在带有用于CCITTFaxDecode过滤器的PyPDF2的Python中: import PyPDF2 import struct """ Links: PDF for ...

  10. python pdf删除图片_使用PyMuPdf提取、删除及替换PDF中的图片文件

    有时候想把PDF中的图片文件提取出来,身为程序员的我当然是自己写段代码来实现,先看看了网上的方法,都是逐行遍历,正则匹配来提取什么的,其实没有那么复杂,PyMuPdf官方文档里自带就有提取图片文件的方 ...

最新文章

  1. Spring 下,关于动态数据源的事务问题的探讨
  2. golang time.After 超时使用理解
  3. ExtJS 4.1更新
  4. vue vue-cli3 修改elementui的date-picker源码 引入node_modules里的element-ui后报错exports is not defined...
  5. Windows下32位汇编语言读取键盘输入单字符
  6. Java内存泄露的理解与解决
  7. CodeForces - 1255D Feeding Chicken(贪心+构造+模拟)
  8. C语言讲义——字符串
  9. 敏捷思维- 架构设计中的方法学(1)
  10. CAD卸载方法,如何完全彻底卸载删除清理干净CAD各种残留注册表和文件? 【转载】
  11. Amesim2016与Matlab2017b联合仿真环境搭建
  12. 【软技能】完全写作指南
  13. 数字移动c语言课程设计,《移动应用开发》课程设计.doc
  14. 高频面试题之JVM灵魂拷问,21题带你通关!
  15. javamail解析邮件,内容重复
  16. Kinect坐标转换
  17. 11s到1s,性能优化之首屏加载
  18. Apache的Order Allow,Deny 规则
  19. 如何在手机上完成日语翻译中文
  20. leetcode 1534. Count Good Triplets(python)

热门文章

  1. fild与fmul的问题
  2. php集成square功能(使用square/connect)
  3. 如何改变iTunes默认备份文件目录
  4. Verilog无符号除法器-状态机实现
  5. 计算机更换固态硬盘方法,详解电脑更换固态硬盘需要重装系统吗
  6. 比较两组数据的差异用什么图更直观_第四节 单因素完全随机实验设计及数据处理...
  7. 【Python入门教程】第35篇 查找元素的位置
  8. 校准证书中的修正值、修正因子,你真的会用吗?
  9. 我是 SPI,我让框架更加优雅了!
  10. 问题:office应用(word、ppt、excel、oneNote) 您的组织策略阻止我们为您完成此操作 解决办法