【Python】PDF转图片
实现快速PDF文件转为png图片
需要安装第三方库 PyMuPDF
pip install PyMuPDF
看好了,是PyMuPDF,不是fitz!!!
导入的和安装的不是同一个,请务必看清楚了,安装错了就不能用;卸载重新安装
最简单的处理方法,直接读取,保存
# -*- coding:utf-8 -*-
import fitz# 直接保存,速度快,不过清晰度或许不好
path = r'123.pdf'
name = path[:path.rfind('.')]
pdf = fitz.open(path)
for i, page in enumerate(pdf):pix = page.getPixmap()pix.writePNG(f'{name}_{i}.png')
放大一定的比例保存,清晰度好【推荐】
# -*- coding:utf-8 -*-
import fitz# 放大一定的比例保存,清晰度好
path = r'123.pdf'
name = path[:path.rfind('.')]
pdf = fitz.open(path)
zx = zy = 2 # 比较推荐放大1.5-2倍,清晰度会好一些
for i, page in enumerate(pdf):mat = fitz.Matrix(zx, zy).preRotate(0)pix = page.getPixmap(matrix=mat)pix.writePNG(f'{name}_{i}.png')
放大+裁剪,满足个性化需求
# -*- coding:utf-8 -*-
import fitz# 放大+裁剪,根据自己的需求来
path = r'123.pdf'
name = path[:path.rfind('.')]
pdf = fitz.open(path)
zx = zy = 2 # 比较推荐放大1.5-2倍,清晰度会好一些
for i, page in enumerate(pdf):mat = fitz.Matrix(zx, zy).preRotate(0)rect = page.rectmp = rect.tl + (rect.br - rect.tl) * 0.5 # 切左上角1/4的区域,所以这里取图片中点clip = fitz.Rect(rect.tl, mp) # 左上角点,右下角点pix = page.getPixmap(matrix=mat, clip=clip)pix.writePNG(f'{name}_{i}.png')
【Python】PDF转图片相关推荐
- python PDF 转 图片
python PDF 转 图片 fitz库 代码 import fitz import time import re import os def pdf2image(pdf_path): '''# 从 ...
- python pdf 转 图片、pdf 转 word、 word 转 pdf
python pdf 转 图片.pdf 转 word. word 转 pdf 文章目录 python pdf 转 图片.pdf 转 word. word 转 pdf 前言 一.环境 二.api文档 三 ...
- python pdf删除图片_【原创】python批量删除pdf图片水印(Xobject)的一种方法
1.说明: 下载到的pdf总会有一些水印,pdf文件水印添加方式除了acrobat adobe自带的以外,还有很多,所以去除水印方法也很多,这里介绍的也只是一种适用python批量删除图片水印Xobj ...
- python pdf与图片互转
背景 PDF转图片网上免费的只能转三次,多次的要么下载安装,要么收费.故自己写代码转换. 环境 1.安装python 2. 安装工具包 pip install PyMuPDF pip install ...
- python pdf和图片互转
1.安装两个包 pip install PyMuPDF==1.18.17 PySimpleGUI==4.47.0 2.pdf转图片 import fitzdef pdf2img(pdf_path, i ...
- python pdf处理 图片_python PDF文件合并、图片处理
一.合并多个PDF文件 实例: #导入模块import codecs import os import PyPDF2 as PyPDF2 #建立一个装pdf文件的数组 files = list()#遍 ...
- python pdf转图片 poppler_Python将PDF转成图片—PyMuPDF和pdf2image
前言:在最近的测试中遇到一个与PDF相关的测试需求,其中有一个过程是将PDF转换成图片,然后对图片进行测试. 粗略的试了好几种方式,其中语言尝试了Python和Java,总体而言所找到的Python方 ...
- python pdf处理 图片_Python 将pdf转换成txt(不处理图片)
上一篇文章中已经介绍了简单的python爬网页下载文档,但下载后的文档多为doc或pdf,对于数据处理仍然有很多限制,所以将doc/pdf转换成txt显得尤为重要.查找了很多资料,在linux下要将d ...
- python pdf处理 图片_在Python中从PDF提取图像而无需重新采样?
在带有用于CCITTFaxDecode过滤器的PyPDF2的Python中: import PyPDF2 import struct """ Links: PDF for ...
- python pdf删除图片_使用PyMuPdf提取、删除及替换PDF中的图片文件
有时候想把PDF中的图片文件提取出来,身为程序员的我当然是自己写段代码来实现,先看看了网上的方法,都是逐行遍历,正则匹配来提取什么的,其实没有那么复杂,PyMuPdf官方文档里自带就有提取图片文件的方 ...
最新文章
- 动态生成treeview
- Datatable中对某列求和,三种不同情况下的方法 .
- java的标量和聚合量_第5节:Java基础 - 必知必会(下)
- 按下enter键禁止页面刷新
- Java加个书名编号约束条件_java 按照题目所给变量名称、类型和方法名称进行编程 求帮助...
- Deployment descriptor
- python竞赛试题及答案_竞赛信息 | 蓝桥杯大赛Python组
- mysql for loop_MySQL循环语句 - Linux就该这么学的个人空间 - OSCHINA - 中文开源技术交流社区...
- java模拟数据库压测_Jeecgboot Feign、分布式压测、分布式任务调度
- 新编计算机英语,新编计算机英语教程
- 为什么大部分人会碌碌无为?
- 安装Linux操作系统
- mysql基线检查_Mysql安全基线检查
- linux使用---automake学习(从原理到实践,一步步完成automake)
- 图解win7中IIS7.0的安装及配置ASP环境
- 国家测绘法宣传日专题知识分享
- 最新发布!2021软科中国大学排名
- VB 从零开始编外挂(完整实践版)
- 关于win7下r3窗口进程保护的一些方式
- OTRS安装使用系列之三——不同的OTRS…
热门文章
- CSS定位中绝对定位和固定定位(重点)
- PHPExcel浏览器输出Excel2007出错
- 如何把pdf拆分成一页一页的图片?
- linux ogv格式转换,使用OGV转换将OGV转换为Linux中的AVI | MOS86
- how-to-solve-the-specific-problem,learn-this,imitate-this
- 如何用python编程编一个可以盗qq的_利用 Python 编写一个类似 QQ 截图的小工具应该怎么入手?...
- Android hook微信 apk 实时获取微信聊天消息记录
- c语言且或者是优先级,C语言笔试题
- 用python发邮件为什么接收不了_如何使用python发送邮件和接收邮件?
- C#与西门子1500通讯案例——基于S7.net+