如何用Python批量将Pdf文档转换成Word文档?
目录
一、前言
二、问题或需求
三、前提条件或注意事项
四、代码设计思路
五、具体执行代码
六、效果观察
七、声明及致谢
八、快捷方式
一、前言
一般情况,WPS系列office软件付费会员都有Pdf文档转Word文档的功能,这里针对不想付费的情况所设计的一套方案。
二、问题或需求
批量将PDF文档转成Word文档。
三、前提条件或注意事项
1.PDF文档的后缀务必是“.pdf”,否则转换不成功,原因是程序设定好了的。
2.大部分的PDF文档都可用这个程序来转换,如果是图片生成的Pdf文档,则转换不成功,原因是要将图片里的文字转换成文档涉及到人工智能的知识,它已超出这个程序的能力范围。但也不用慌,遇到此情况,可以用QQ的文件助手来帮忙,此处不赘述。
四、代码设计思路
1.运用到核心第三方库“pdf2docx”。
2.定义转换函数并运行。
五、具体执行代码
import os
from pdf2docx import Converterdef pdf_docx():# 获取当前工作目录file_path = 'C:/Users/1223/Desktop/OK'# 遍历所有文件for file in os.listdir(file_path):# 获取文件后缀suff_name = os.path.splitext(file)[1]# 过滤非pdf格式文件if suff_name != '.pdf':continue# 获取文件名称file_name = os.path.splitext(file)[0]# pdf文件名称pdf_name = file_path + '\\' + file# 要转换的docx文件名称docx_name = file_path + '\\' + file_name + '.docx'# 加载pdf文档cv = Converter(pdf_name)cv.convert(docx_name)cv.close()if __name__ == '__main__':pdf_docx()
六、效果观察
1.运行代码即可实现转换。2.缺陷:无法将图片上的文字转换成文档,此处仍须改进。
七、声明及致谢
笔者记不清是哪个大神的源代码了,总之,已被适当改装。
八、快捷方式
笔者将程序打包成任何人都可执行的exe程序文件,放在附件(左上角)里供大家下载使用。
注意:该程序设置的桌面文件的路径是:C:\Users\Administrator\Desktop\,如有不同,可联系笔者对源代码进行修改、打包,后再交付使用。在确保这一前提条件下,操作如下:
1.在桌面建立名为“OK”(大写)的文件夹。
2.把所需转换的PDF文件放入文件夹,然后点击程序运行即可。
备注:这里没有附件可上传,可联系笔者获取。
如何用Python批量将Pdf文档转换成Word文档?相关推荐
- pdf文件如何转换成word文档呢?
在日常办公中经常会因为一些文件格式而头疼,比如说遇到PDF转换成Word格式的需求,毕竟PDF编辑起来很不方便.如果你想修改内容,你必须先把PDF转换成其他格式.比如word文档就是一个很好的选择,而 ...
- PPT幻灯片文档转换成Word文档怎么转?
PPT幻灯片文档和Word文档都是常用的文档格式,如果我们在使用PPT幻灯片文档时,想要将PPT转换成Word文档,那么应该怎么进行转换?PPT幻灯片文档转换成Word文档怎么转?平时我们制作的ppt ...
- 怎么把html文档转换成wps,怎么把wps文档转换成word文档
您可能感兴趣的话题: wps 核心提示:今天,我们就来学习一下将wps转换成word的方法,包括了修改文件后缀名的方法.另外为doc格式的方法.下面就一起来看看具体的内容吧! 我们知道,电脑安装的是金 ...
- PDF要如何转换成Word文档呢?
Word和pdf是办公室常用的软件,这两种格式都有各自的优缺点,但如果相互使用会形成互补.毕竟打开和阅读这些PDF文件比较方便,但是有时需要对PDF添加一些内容,而在这里面就比较困难,需要对PDF文件 ...
- 将Latex tex文档转换成 word文档(上)
有时候逼不得已,必须得将自己精心排版好的latex 文档 转换成word 给别人编辑 下面提供一个方法 下载 Tex2Word 工具,地址我的网盘 安装 解压后安装,使用默认安装路径 安装过程中,点击 ...
- pdf、caj转换成word文档(最新最有效的方法)
pdf或caj文档转换如何为word文档,相信这个问题一直缠绕着很多人.当然也有很多的方法经验,小编也去看过了,不过那些方法不是收费就是乱码,根本不能满足广大群众.下面小编就为大家分享一个最新最有效的 ...
- 赛效:如何将PDF文件免费转换成Word文档
1:在网页上打开wdashi,默认进入PDF转Word页面,点击中间的上传文件图标. 2:将PDF文件添加上去之后,点击右下角的"开始转换". 3:稍等片刻转换成功后,点击绿色的& ...
- 将Latex tex文档转换成 word文档(下)
在上篇中我们介绍了一款将 tex 文件转换成 word 文件的工具 借用万能的搜索引擎,在 Google 上找到了更好的工具 它就是Pandoc 介绍 Pandoc 是由 John McaFarlan ...
- xml文件怎么转换成wps_xml文件转word文档 怎么将XML文档转成WORD文档
1.找到需要转换为word文档的xml文档. 2.选择文档并点击鼠标右键,选择"打开方式"栏目中的"WPS表格"(或者excel表格),点击确定按钮. 3.点击 ...
最新文章
- 谈一谈浏览器解析CSS选择器的过程【前端每日一题-6】
- 【转载】Deep learning:十九(RBM简单理解)
- (二)SpringMVC之执行的过程
- python_四元数q转旋转矩阵R(已验证)
- 云服务器与传统服务器的优劣对比_相比于传统服务器,云服务器的优势在哪
- 【股价预测】基于matlab遗传算法优化BP神经网络预测股价【含Matlab源码 1250期】
- InTouch软件介绍
- ubuntu 10.04 下安装 wine 所得所获【转】
- wamp中php无法启动,wamp无法正常启动
- Word文档输出为pdf时目录出现“错误!未定义书签!”
- linux wrf 系统_WRF在Linux环境下的安装
- Java实现仿win10计算器
- 关于C++中<iostream>操作算子ends显示问题
- SuperMap GIS地质体数据处理QA
- 常见服务器类型及其简单介绍
- 华为2019年第一季度业绩曝光;联想and谷歌加入英特尔新晋云计划;即特斯拉起火,蔚来ES8也维修起了火...
- 华为、苹果,为何“盯”上二手机?
- Android中自定义弧形的seekbar
- vs2008与vss2005用后感
- 计算机奖项含金量排名,大家一起拍下NBA常规赛各项奖项含金量排名,都是个人观点,讨论讨论...
热门文章
- 安利一个方便加载百度地图的js插件
- Springboot错误--would dispatch back to the current handler URL [/XXX] again. Check your ViewResolv
- Mac安装win10双系统蓝牙连接不上故障问题
- python3异步task_Python异步编程4:task对象
- 使用FLEX 和 Actionscript开发FLASH 游戏(一)
- 人工智能在医学领域应用的现状与展望
- 2022-3-15 安装fcl的依赖库ccd,动态链接库和静态链接库
- 英文pdf翻译中文,试试这个在线文档翻译平台
- 机械臂运动空间的计算_机器人学导论---第八章 操作臂的机械设计(一)8.1-8.9...
- 基于51单片机电子秒表倒计时器proteus仿真 汇编程序 数码管显示LCD1602显示