python pdf转图片
需求
将pdf的第一页即为封面转为图片。
所有pdf在同一个目录下,
生成的图片在同目录下的img文件夹内。
图片命名即为pdf的名字。
使用
pip install PyPDF2
pip install pdf2image
同时下载poppler,下载地址是:
https://blog.alivate.com.au/wp-content/uploads/2018/08/poppler-0.67.0_x86.7z
解压压缩包,将poppler/bin/ 目录添加至电脑的path的环境变量里。
注意一定要重启!否则没有生效
代码
from PyPDF2 import PdfFileReader, PdfFileWriter
import glob
import os
from pdf2image import convert_from_path
import shutildef pdf2image2(pdfPath, imagePath):images = convert_from_path(pdfPath, dpi=96)for image in images:if not os.path.exists(imagePath):os.makedirs(imagePath)pngname=pdfPath[6:-4]image.save(imagePath+'/'+pngname+'.png', 'PNG')def process_bar(no, total_length):bar = '\r' + str(no) + '|' + str(total_length)print(bar, end='', flush=True)def split_combine(path, pdf_writer):pdf = PdfFileReader(path, strict=False)# lastest pagepage = pdf.getPage(0)pdf_writer.addPage(page)if __name__ == '__main__':# get curren dir pdf filespdf_list = glob.glob('*.pdf')pdf_writer = PdfFileWriter()imgpath="./img/"tmppath="./tmp/"if not os.path.exists(imgpath):os.makedirs(imgpath)if not os.path.exists(tmppath):os.makedirs(tmppath)for i, pdf_file in enumerate(pdf_list):process_bar(i + 1, len(pdf_list))split_combine(pdf_file, pdf_writer)with open(tmppath+pdf_file, 'wb') as output_pdf:pdf_writer.write(output_pdf)pdf2image2(tmppath+pdf_file, imgpath)shutil.rmtree(tmppath)
python pdf转图片相关推荐
- python PDF 转 图片
python PDF 转 图片 fitz库 代码 import fitz import time import re import os def pdf2image(pdf_path): '''# 从 ...
- python pdf 转 图片、pdf 转 word、 word 转 pdf
python pdf 转 图片.pdf 转 word. word 转 pdf 文章目录 python pdf 转 图片.pdf 转 word. word 转 pdf 前言 一.环境 二.api文档 三 ...
- python pdf删除图片_【原创】python批量删除pdf图片水印(Xobject)的一种方法
1.说明: 下载到的pdf总会有一些水印,pdf文件水印添加方式除了acrobat adobe自带的以外,还有很多,所以去除水印方法也很多,这里介绍的也只是一种适用python批量删除图片水印Xobj ...
- python pdf与图片互转
背景 PDF转图片网上免费的只能转三次,多次的要么下载安装,要么收费.故自己写代码转换. 环境 1.安装python 2. 安装工具包 pip install PyMuPDF pip install ...
- python pdf和图片互转
1.安装两个包 pip install PyMuPDF==1.18.17 PySimpleGUI==4.47.0 2.pdf转图片 import fitzdef pdf2img(pdf_path, i ...
- python pdf处理 图片_python PDF文件合并、图片处理
一.合并多个PDF文件 实例: #导入模块import codecs import os import PyPDF2 as PyPDF2 #建立一个装pdf文件的数组 files = list()#遍 ...
- python pdf转图片 poppler_Python将PDF转成图片—PyMuPDF和pdf2image
前言:在最近的测试中遇到一个与PDF相关的测试需求,其中有一个过程是将PDF转换成图片,然后对图片进行测试. 粗略的试了好几种方式,其中语言尝试了Python和Java,总体而言所找到的Python方 ...
- python pdf处理 图片_Python 将pdf转换成txt(不处理图片)
上一篇文章中已经介绍了简单的python爬网页下载文档,但下载后的文档多为doc或pdf,对于数据处理仍然有很多限制,所以将doc/pdf转换成txt显得尤为重要.查找了很多资料,在linux下要将d ...
- python pdf处理 图片_在Python中从PDF提取图像而无需重新采样?
在带有用于CCITTFaxDecode过滤器的PyPDF2的Python中: import PyPDF2 import struct """ Links: PDF for ...
- python pdf删除图片_使用PyMuPdf提取、删除及替换PDF中的图片文件
有时候想把PDF中的图片文件提取出来,身为程序员的我当然是自己写段代码来实现,先看看了网上的方法,都是逐行遍历,正则匹配来提取什么的,其实没有那么复杂,PyMuPdf官方文档里自带就有提取图片文件的方 ...
最新文章
- Spring 下,关于动态数据源的事务问题的探讨
- golang time.After 超时使用理解
- ExtJS 4.1更新
- vue vue-cli3 修改elementui的date-picker源码 引入node_modules里的element-ui后报错exports is not defined...
- Windows下32位汇编语言读取键盘输入单字符
- Java内存泄露的理解与解决
- CodeForces - 1255D Feeding Chicken(贪心+构造+模拟)
- C语言讲义——字符串
- 敏捷思维- 架构设计中的方法学(1)
- CAD卸载方法,如何完全彻底卸载删除清理干净CAD各种残留注册表和文件? 【转载】
- Amesim2016与Matlab2017b联合仿真环境搭建
- 【软技能】完全写作指南
- 数字移动c语言课程设计,《移动应用开发》课程设计.doc
- 高频面试题之JVM灵魂拷问,21题带你通关!
- javamail解析邮件,内容重复
- Kinect坐标转换
- 11s到1s,性能优化之首屏加载
- Apache的Order Allow,Deny 规则
- 如何在手机上完成日语翻译中文
- leetcode 1534. Count Good Triplets(python)
热门文章
- fild与fmul的问题
- php集成square功能(使用square/connect)
- 如何改变iTunes默认备份文件目录
- Verilog无符号除法器-状态机实现
- 计算机更换固态硬盘方法,详解电脑更换固态硬盘需要重装系统吗
- 比较两组数据的差异用什么图更直观_第四节 单因素完全随机实验设计及数据处理...
- 【Python入门教程】第35篇 查找元素的位置
- 校准证书中的修正值、修正因子,你真的会用吗?
- 我是 SPI,我让框架更加优雅了!
- 问题:office应用(word、ppt、excel、oneNote) 您的组织策略阻止我们为您完成此操作 解决办法