用python把pdf文件转换为word文件
安装pip install pdf2docx:
pip install pdf2docx
如果安装过程出现报错,可能是版本匹配问题,先安装PyMuPDF这个库即可正常安装pip install PyMuPDF。
pip install PyMuPDF
安装好后,把需要转换的PDF文档放到和python代码同一个文件夹内。
python代码:
import os
from pdf2docx import Converterdef pdf_docx():# 获取当前工作目录file_path = os.getcwd()# 获取所有文件files = os.listdir(file_path)# 遍历所有文件for file in files:# 过滤临时文件if '~$' in file:continue# 过滤非pdf格式文件if file.split('.')[-1] != 'pdf':continue# 获取文件名称file_name = file.split('.')[0]# pdf文件名称pdf_name = os.getcwd() + '\\' + file# docx文件名称docx_name = os.getcwd() + '\\' + file_name + '.docx'# 加载pdf文档cv = Converter(pdf_name)cv.convert(docx_name, start=0, end=12)cv.close()if __name__ == '__main__':pdf_docx()
start是pdf转换的起始页,end是结束页。如果不传入start和end这两个参数,默认就是从第一页转换到最后一页。也可以通过pages方法确定转换页数,方法为:cv.convert(docx_file, pages=[0,2, 5])
用python把pdf文件转换为word文件相关推荐
- java pdf 转换 word_如何使用Java将pdf文件转换为word文件
如何使用Java将pdf文件转换为word文件? 而且,它看起来像它一样容易吗? 解决方法: public class PDFTextReader { static String pdftoText( ...
- 在Word2013中如何将PDF文件转换为Word文件
Word和PDF文件之间的相互转换在我们的生活中是经常需要用到的,也是曾经困扰了很多人的一个问题,现在好了,Word2013可以直接帮我们将PDF文件转换为 Word 文件了,小伙伴儿们有没有惊呆了呢 ...
- 将Pdf文件转换为Word
在Word 2013里面,我们可以打开一个PDF文件,并对其进行编辑,重新保存后,实现将PDF文件转换为Word文件 下面由简单的代码VBA代码实现将某个目录下所有的PDF文件转为Word文件 Sub ...
- 苹果手机如何将PDF文件转换为Word文档
作为职场小白一遇到文件转换就头疼,特别是下班了之后手机接收到的PDF文件,电脑又不在身边,手机又不会转换,是不是很多人都有我这样的苦恼,但是小编今天就在这告诉大家,手机上市可以实现PDF文件转换Wor ...
- pdf文件转word文件,word转pdf文件小程序
在平时生活.学习中总会遇到一些文件格式的转化问题,在很多软件啊,网站都可以转换,但是都要付钱的:面对这个问题我也是经历过的,学习了python发现文件转换不就轻轻松松吗,接下来我带大家一起来学习如何进 ...
- 教程:使用C#将HTML网页转换为Word文件
HTML文件经常用于创建,编辑或传达许多信息.同样,由于功能不同,Microsoft Word文件(包括DOCX和DOC)也很出名.在本文中将了解使用C#保真地将HTML网页文件转换为Word文件.( ...
- C# 将PDF文件转换为word格式
Pdf(Portable Document Format)意为"便携式文档格式",是现在最流行的文件格式之一,它有很多优点如:尺寸较小.阅读方便.操作系统平台通用等,非常适合在网络 ...
- 如何快速将PDF文件转换为Word文档
PDF文件是一个广泛使用的电子文档格式,其被广泛应用于各种领域,包括教育.商业和政府.虽然PDF文件非常实用,但有时你需要将其转换为Word文档,以便更方便地编辑和处理.以下是几种快速将PDF文件转换 ...
- pdf文件如何转换为word文件 [转载]
平时工作时,经常有pdf文件转换为word格式的时候,本人研究了下,pdf文件也分为两种,有种是纯图像形式的,另外中是非纯图像的,也就是这种pdf在pdf软件中,文字都可以被款选的!对于这种转换是比较 ...
- caj 格式的文件转换为word
caj 格式的文件转换为word 写毕业论文,搜索参考文献时,虽然有的论文可以选择下载pdf格式,但部分论文只能下载caj格式的. 因为中国知网有自己独有的论文格式,caj格式 步骤 1. 下载CA ...
最新文章
- 线程的介绍(概念、作用)
- 《杀破狼》:可能是华语动作电影最后的绝唱!
- vs2010转移ipch和sdf的位置
- 1.1_简单递归 (汉诺塔问题 / 进制转换)
- filestream_SQL Server FILESTREAM内部概述
- 工欲善其事必先利其器,用Emmet提高HTML编写速度
- Spring Boot (30) 上传文件
- HDFS 中常见的Timeout
- 洗清UI自动化鸡肋说的不白之冤
- 读《About Face 4 交互设计精髓》7
- 微信小程序input组件里,自动聚焦focus没反应
- 带有风的诗词_带有风的诗句
- 如何选择适合你的兴趣爱好(六十一),瓷器
- 计算机一级应用基础选择题,2016一级计算机基础及MSOffice应用选择题
- PTA乙级1014(python3)
- CString、CTime和COleDateTime转换
- 《缠中说禅108课》22:将 8 亿的大米装到 5 个庄家的肚里
- 数字VR虚拟博物馆的功能介绍
- bsdiff算法c语言实现,iOS 使用bsdiff进行资源文件增量更新(bsdiff / bspatch)
- URL is not registered
热门文章
- unity 使用粒子系统 实现一个火焰燃烧效果
- Excel将一个表格的格式复制到其他表格,不用格式刷
- LeetCode--476. 数字的补数
- 7-39 龟兔赛跑 (20 分) 乌龟与兔子进行赛跑,跑场是一个矩型跑道,跑道边可以随地进行休息。T分钟后乌龟和兔子谁跑得快?PTA:中M2021春C、Java入门练习第I段—变量、表达式、分支、循环
- 如何利用Social Listening从社会化媒体中“提炼”有价值的信息?
- 手机网站支付-支付宝API-Python
- 详解矩阵算法在电商sku组件中的应用一
- STM32与MPC-6050通讯
- 世界最早投入运行的计算机网络是,世界上最早投入运行的计算机网络是。
- open-flash-chart 与 FusionCharts 开发中使用(转)