最近有相关需求就用Python做了一个PDF处理工具代码如下:

不想写代码的可以用打包好EXE

https://download.csdn.net/download/qq_36497454/53542250

# main.py
# Python3.x 导入方法from window import MainWindowmain_window_class = MainWindow()window = main_window_class.get_window()
# 进入消息循环
window.mainloop()# MainWindow.py
# Python3.x 导入方法
import os
from tkinter import *
from tkinter import filedialog
from imageUtil import pyMuPDF_fitz
from wordUtil import PDFtoWordclass MainWindow:pdf_path: objectdef __init__(self):# 创建窗口对象的背景色self.pdf_path = Noneself.dir_path = Noneself.window = Tk()# self.window.attributes('-topmost', True)# 窗口名self.window.title('PDF文件转化器')# 几何位置self.window.geometry('600x400+50+100')# PDF文件标签self.pdf_lable = Label(self.window, text="PDF:")self.pdf_lable.place(x=100, y=25)# 文件文本框self.pdf_text = Text(self.window, bd=5, width=30, height=2)self.pdf_text.place(x=180, y=20)# 选择PDF文件按钮self.pdf_button = Button(self.window, text="选择PDF", width=10, command=self.set_pdf)self.pdf_button.place(x=440, y=20)# 目录标签self.dir_lable = Label(self.window, text="保存目录:")self.dir_lable.place(x=100, y=75)# 目录文本框self.dir_text = Text(self.window, bd=5, width=30, height=2)self.dir_text.place(x=180, y=70)# 选择图片目录按钮self.dir_button = Button(self.window, text="保存目录", width=10, command=self.set_dir)self.dir_button.place(x=440, y=70)# 转化按钮self.change_image_button = Button(self.window, text="生成图片", width=10, command=self.pdf_image)self.change_image_button.place(x=150, y=150)self.change_word_button = Button(self.window, text="生成word", width=10, command=self.pdf_word)self.change_word_button.place(x=450, y=150)def get_window(self):return self.windowdef set_pdf(self):# 获取所选文件self.pdf_path = filedialog.askopenfilename()self.pdf_text.delete(1.0, END)self.pdf_text.insert(1.0, self.pdf_path)def set_dir(self):# 获取所选文件self.dir_path = filedialog.askdirectory()self.dir_text.delete(1.0, END)self.dir_text.insert(1.0, self.dir_path)def pdf_image(self):pyMuPDF_fitz(self.pdf_path, self.dir_path)def pdf_word(self):file_name = os.path.basename(self.pdf_path).split(".")[0]word_path = self.dir_path + '/' + file_name + ".doc"PDFtoWord(self.pdf_path, word_path)# PDFtoWord.py
from pdf2docx import Converter# 读取PDF
def PDFtoWord(pdf_file, docx_file):# convert pdf to docxcv = Converter(pdf_file)cv.convert(docx_file, start=0, end=None)cv.close()# pyMuPDF_fitz.pyimport datetime
import os
import loggingimport fitz  # fitz就是pip install PyMuPDFdef pyMuPDF_fitz(pdf_path, image_path):pdfDoc = fitz.open(pdf_path)file_name = os.path.basename(pdf_path).split(".")[0]for pg in range(pdfDoc.pageCount):page = pdfDoc[pg]rotate = int(0)# 每个尺寸的缩放系数为1.3,这将为我们生成分辨率提高2.6的图像。# 此处若是不做设置,默认图片大小为:792X612, dpi=96zoom_x = 1.33333333  # (1.33333333-->1056x816)   (2-->1584x1224)zoom_y = 1.33333333mat = fitz.Matrix(zoom_x, zoom_y).preRotate(rotate)pix = page.getPixmap(matrix=mat, alpha=False)if not os.path.exists(image_path):  # 判断存放图片的文件夹是否存在os.makedirs(image_path)  # 若图片文件夹不存在就创建pix.writePNG(image_path + '/' + file_name+'_%s.jpg' % pg)  # 将图片写入指定的文件夹内

Python PDF转图片 Word相关推荐

  1. python pdf 转 图片、pdf 转 word、 word 转 pdf

    python pdf 转 图片.pdf 转 word. word 转 pdf 文章目录 python pdf 转 图片.pdf 转 word. word 转 pdf 前言 一.环境 二.api文档 三 ...

  2. Python PDF文件转Word格式

    1.免费在线转换网站 PDF转换器,限制50页: http://pdfdo.com/pdf-to-word.aspx 迅捷PDF转换器,限制2M: http://app.xunjiepdf.com/p ...

  3. python PDF 转 图片

    python PDF 转 图片 fitz库 代码 import fitz import time import re import os def pdf2image(pdf_path): '''# 从 ...

  4. python pdf删除图片_【原创】python批量删除pdf图片水印(Xobject)的一种方法

    1.说明: 下载到的pdf总会有一些水印,pdf文件水印添加方式除了acrobat adobe自带的以外,还有很多,所以去除水印方法也很多,这里介绍的也只是一种适用python批量删除图片水印Xobj ...

  5. python pdf与图片互转

    背景 PDF转图片网上免费的只能转三次,多次的要么下载安装,要么收费.故自己写代码转换. 环境 1.安装python 2. 安装工具包 pip install PyMuPDF pip install ...

  6. python pdf和图片互转

    1.安装两个包 pip install PyMuPDF==1.18.17 PySimpleGUI==4.47.0 2.pdf转图片 import fitzdef pdf2img(pdf_path, i ...

  7. Python PDF文件转Word格式,只需要3秒(附打包)

    PDF文档遵循一定的规范,例如精确定位了每个字符出现在页面上的坐标.根据坐标绘制的各种形状(线.矩形.曲线等).所以,用PDF格式传输和打印文档可以保证格式的一致性,不会像Word那样因为渲染引擎的不 ...

  8. python pdf处理 图片_python PDF文件合并、图片处理

    一.合并多个PDF文件 实例: #导入模块import codecs import os import PyPDF2 as PyPDF2 #建立一个装pdf文件的数组 files = list()#遍 ...

  9. python pdf转图片 poppler_Python将PDF转成图片—PyMuPDF和pdf2image

    前言:在最近的测试中遇到一个与PDF相关的测试需求,其中有一个过程是将PDF转换成图片,然后对图片进行测试. 粗略的试了好几种方式,其中语言尝试了Python和Java,总体而言所找到的Python方 ...

  10. python pdf处理 图片_Python 将pdf转换成txt(不处理图片)

    上一篇文章中已经介绍了简单的python爬网页下载文档,但下载后的文档多为doc或pdf,对于数据处理仍然有很多限制,所以将doc/pdf转换成txt显得尤为重要.查找了很多资料,在linux下要将d ...

最新文章

  1. 为什么 ConcurrentHashMap 的读操作不需要加锁?
  2. 2021年春季学期-信号与系统-第十二次作业参考答案-第二小题
  3. postgresql+postgis安装
  4. Android 6.0权限分组
  5. 使用Windows Server 2003搭建一个asp+access网站
  6. [转载] python+opencv图像处理:numpy数组操作
  7. PHP图片验证码制作(上)
  8. python实现将字符串转化为数字(逆序输出)
  9. Oracle19c下载安装和配置教程
  10. Matlab中CIC滤波器的应用
  11. Undefined function or variable. The first assignment to a local variable determin its class.
  12. 京东2021年全渠道GMV同比增长近80% 全年营收同步增长27.6%
  13. Windows服务器tomcat日志拆分(cronolog )
  14. matlab jacks信道,【学习笔记】移动无线信道理论
  15. 免费天气API,天气JSON API,天气插件
  16. 客户协作 over 合同谈判
  17. VBA---查单元格,行/列,区域边界情况,用end(xlup) .row , end(xldown) .row 等
  18. 百度刘捷:数据驱动,AI赋能助力城市数字化转型
  19. 自定義ListActivity(一)
  20. 判断一个数是否为素数(调用函数)

热门文章

  1. 百度地图java批量获得经纬度_批量调用百度地图API获取地址经纬度坐标
  2. Javaweb面试题及答案
  3. 使用APP inventor制作蓝牙串口助手【智能浇灌模型中用到】
  4. hua图软件 mac_10款Mac上设计师必备的设计绘图工具推荐和下载 | 玩转苹果
  5. Zynq AXI总线
  6. Introduction to Convex Optimization Basic Concepts 详细
  7. ITK-SNAP自动分割应用示例:如何进行乳腺腺体脂肪体积测量
  8. HLW8032功率计+esp8266WiFi插座 mixly blynk
  9. 电脑截图怎么转换成文字?学会这个方法,轻松实现
  10. 2019最新《web前端课程+项目实践课程》高清无拼凑