使用python进行pdf的格式转换

  • 前言
  • 两个关键功能
    • 转图片
    • 转docx

前言

在使用文本编辑软件时经常会想将PDF转为图片或者是文档格式,但大多要么得付费要么带有一些捆绑,不如自己写一下。
这里使用了pdf2image和pdf2docx进行转换。

两个关键功能

转图片

def file2Pic():global i, pdf_name, file_formatif pdf_name == '':tk.messagebox.showwarning(message='请选择需要导出文件')else:if var == 0:tk.messagebox.showwarning(message='请选择需要导出文件类型')print(2)else:i = 0total_file = pdf_name[:-4]mkdir(total_file)pages = convert_from_path(pdf_name, 500)for page in pages:file_name = total_file + '/' + str(i) + file_formatpage.save(file_name, 'JPEG')i += 1counter_l.config(text='转换完成')

其中file_format为导出格式,为了图省事,没有将保存格式进行选择,而是将文件名直接按照后缀进行存储达到可以保存为jpg、bmp、png的格式。

转docx

这部分使用开源项目pdf2docx,可以在这里看到如何使用。
这个开源项目可以实现pdf2docx的几种功能为
段落及文本样式

段落对齐方式(左/右/居中/分散)及段间距
水平(自左向右)或竖直(自底向上)方向的文本
字体样式(颜色、字体、大小、粗/斜体)
文本样式(高亮、下划线、删除线、超链接)
但对列表样式的识别效果欠佳

图片

段落内嵌入型图片
衬于文本下方的浮动型图片
支持Gray/RGB/CMYK等颜色模式及透明背景图片

表格及其样式

边框样式(粗细、颜色)
单元格背景色
合并的单元格
隐藏部分边框的表格(例如三线表)
嵌套表格

支持多进程并行处理

def file2Docx():global pdf_namecv = Converter(pdf_name)total_file = pdf_name[:-4]mkdir(total_file)docx_name = total_file + '/PDF2Docx.docx'cv.convert(docx_name, start=0, end=None)cv.close()

最后对gui界面进行了一个简单的绘制。基本功能可以实现,但再打开的时候是根据本机的速度来定。

这里建了一个gitee的项目仓库,希望可以得到各位的指点或共同开发。

使用python制作pdf的格式转换程序相关推荐

  1. python制作pdf教程_学以致用:Python爬取廖大Python教程制作pdf!

    学以致用:Python爬取廖大Python教程制作pdf! python-tutorial-pdf 当我学了廖大的Python教程后,感觉总得做点什么,正好自己想随时查阅,于是就开始有了制作PDF这个 ...

  2. 【Python办公自动化】使用reportlab制作pdf报告

    原文作者:我辈李想 版权声明:文章原创,转载时请务必加上原文超链接.作者信息和本声明. Python使用folium制作地图并生成png图片 第一章 folium的方法和类的介绍(思维导图) 第二章 ...

  3. python pyqt5教程pdf_PyQt5 从零开始制作 PDF 阅读器(一)

    关注微信公众号 Python高效编程后台回复 2019324 来获取源代码 此前,我已经写了三篇关于 Ui 界面的文章,分别是:猜数游戏.计时器程序和天气查询软件.这次,我们使用 Python 实现 ...

  4. python图片转pdf文件_用python 制作图片转pdf工具

    这篇文章主要介绍了用python 制作图片转pdf工具的思路及代码,非常详细,有需要的小伙伴参考下 最近因为想要看漫画,无奈下载的漫画是jpg的格式,网上的转换器还没一个好用的,于是乎就打算用pyth ...

  5. python实现pdf转word详解_手把手|20行Python代码教你批量将PDF文件转为Word格式(包教包会)...

    在日常工作或学习中,经常会遇到这样的无奈: "小任,你把这个PDF中的文件码出来发我" 倒霉,2M的PDF12点也完不了啊! 很多时候在学习时发现许多文档都是PDF格式,PDF格式 ...

  6. Python解析pdf转为TXT格式

    #完成pdf到TXT转变了,无法完成TXT到Excel转变import xlwt # 写入文件 import xlrd # 打开excel文件 from xlutils.copy import cop ...

  7. python发html邮件_在python中如何制作发送HTML格式的邮件?

    邮件的设计和制作,作为邮件营销的重要环节,直接影响着一次营销活动转化.我们知道,不同的邮件客户端有不同的解析规则.一封设计精美的邮件,如果Html格式不规范,在客户端显示的效果往往会大打折扣.所以,如 ...

  8. python编程之美pdf_GitHub - Farolding/toPdf: 爬取“Python编程之美:最佳实践指南”制作PDF电子书...

    准备工作 爬取HTML页面转成PDF需要用到wkhtmltopdf工具,下载地址:https://wkhtmltopdf.org/downloads.html ,pdfkit是wkhtmltopdf的 ...

  9. python把pdf转word_手把手|20行Python代码教你批量将PDF文件转为Word格式(包教包会)...

    作者:菜鸟分析 Python爱好者社区--专栏作者 个人介绍:一个痴迷于Python语言的业余程序猿,未来的理想是能够与一群痴迷于Python语言的程序猿改变世界 知乎专栏: https://zhua ...

  10. 制作pDF 格式电子书

    制作pDF 格式电子书不是很复杂. 原材料一般分为doc文件 与图片. 如果原材料是doc  文件,那就下载一个PDF Generator 软件  ,先安装上这儿软件. 然后打开doc   文档 操作 ...

最新文章

  1. android运行过程简书,Android系统的启动流程
  2. 3dsmax biped 骨骼姿势 对称操作
  3. C#-DataSet和DataTable详解
  4. 第14期师资培训火热招生中,尽享国赛智能车一手资料
  5. Linux2.6 内核进程调度分析
  6. 面试:ArrayList哪种遍历效率最好?
  7. Atlassian In Action - (Atlassian成长之路)
  8. 路由器 和 交换机 傻傻分不清楚
  9. VTK:图像迭代器用法实战
  10. ORACLE expdp/impdp详解
  11. 淘淘商城之技术选型、开发工具和环境、人员配置
  12. (组合数学笔记)Pólya计数理论_Part.1_群的基本概念
  13. 02-创建hibernate工程
  14. Sublime Text插件:HTML+CSS+JAVASCRIPT+JSON快速格式化
  15. StanfordDB class自学笔记 (4) XML Data
  16. PHP 中的 use function是什么意思
  17. js引用本地json文件
  18. 微信公众平台——用户管理
  19. SpringCloudAlibaba之gateway网关
  20. 学习+科研+做项目 深度学习最全详细资料

热门文章

  1. android gps信号检测工具,【分享】GPS Test Plus全球GPS定位卫星信号检测工具
  2. X4扭曲字体或图形 coreldraw_cdrx4精简版下载|coreldraw x4 sp2 精简版下载增强版 15.2.3.1614 - 系统天堂...
  3. C# - Poker Sort
  4. 【报告分享】 2020-2021年数字内容产业趋势报告-企鹅智库 (附下载)
  5. 一招解决origin8 licience过期
  6. FU-A STAP-A 拆包 打包 小议
  7. Markdown工具之Typora--画思维导图
  8. 你是否想拥有一款自己的直播软件?
  9. 聚类分析-K-means clustering 在生物信息学中的应用
  10. 小米路由器设置无线中继模式