python将doc文件转换docx
一:python将doc文件批量转换docx:
# -*- coding:utf-8 -*-
# @Author : yyzhang
import os
import time
from win32com import clientdef doc_to_docx(list_dir,save_file):word = client.Dispatch("Word.Application") # 打开word应用程序filename_list = [i for i in list_dir if i.split(".")[-1] == "doc"]# filename_list=[os.path.join(folder,j) for j in li ]# print(filename_list)# time.sleep(10)try:for file in filename_list:print("开始转换:",file)# print(file)# 将doc的文件名换成后缀为docx的文件name = os.path.splitext(file)[0] + '.docx'# 将我们的docx与文件保存位置拼接起来,获得绝对路径out_name = os.path.join(save_file,name) #print("测试后:",name)print("转换后:",out_name)# out_file.append(out_name)file_path=os.path.join(folder,file)doc = word.Documents.Open(file_path) # 打开word文件# doc.SaveAs("{}".format(out_name), 12) # 另存为后缀为".docx"的文件,其中参数12或16指docx文件doc.SaveAs("{}".format(out_name), 12, False, "", True, "", False,False, False,False) # 转换后的文件,12代表转换后为docx文件doc.Close() # 关闭原来word文件except Exception as e:print(e)word.Quit()if __name__ == "__main__":# 支持文件夹批量导入folder = 'C:\\Users\\Desktop\\DOC_docx\\doc-file'list_dir=os.listdir(folder)# print(list_dir)out_dir = 'C:\\Users\\Desktop\\DOC_docx\\doc-file1'doc_to_docx(list_dir,out_dir)
二:python将docx文件转换pdf:
import comtypes.client
import win32com
import os
import systry:from comtypes import client
except ImportError:client = Nonetry:from win32com.client import constants, gencache
except ImportError:constants = Nonegencache = Nonedef doc2pdf(docPath, pdfPath):docPathTrue = os.path.abspath(docPath)# word = gencache.EnsureDispatch('Word.Application')word = win32com.client.DispatchEx('Word.Application')doc = word.Documents.Open(docPathTrue, ReadOnly=1)doc.ExportAsFixedFormat(pdfPath,constants.wdExportFormatPDF,Item=constants.wdExportDocumentWithMarkup,CreateBookmarks=constants.wdExportCreateHeadingBookmarks)word.Quit(constants.wdDoNotSaveChanges)
doc2pdf(r"C:\Users\Desktop\DOC_docx\new_docx\语音专线协议.docx",r"C:\Users\Desktop\DOC_docx\语音专线协议.pdf")
python将doc文件转换docx相关推荐
- doc转docx文件会乱吗_利用python将doc文件转换为docx
需求:最近在研究word文档的抽取,发现python中docx库只能提取以docx结尾的文件,因此需要将doc文件转换为docx. 基础知识了解 1.什么是doc? 汉语:文档(外语全称:Docume ...
- open一个绝对路径地址 python_实例15:用Python批量转换doc文件为docx文件
python-docx模块虽然强大,但却不能处理后缀为".doc"的word文件.如果强制读取doc文件,将会报如下错误. import docx #导入docx库doc = do ...
- 使用poi根据模版生成word文档并转换成PDF文件(可处理doc文件与docx文件版)
该篇文章是<使用poi根据模版生成word文档并转换成PDF文件>后续解决传入文件为doc文档或docx的处理方法 /*** 根据模板生成word** @param path 模板的路径* ...
- .doc文件转换为.docx文件
.doc文件转换为.docx文件的python程序 #此程序调用wps来工作,如果只安装有word,则需要适当调整程序. #此程序将在待处理文件夹下新建一个名为'new'的目录,将转换后的.docx放 ...
- 用Python将word文件转换成html(转)
用Python将word文件转换成html 序 最近公司一个客户大大购买了一堆医疗健康方面的科普文章,希望能放到我们正在开发的健康档案管理软件上.客户大大说,要智能推送!要掌握节奏!要深度学习!要让用 ...
- python word处理_妙用Python将word文件转换成html 方法超简单
什么方法可以将word文件转换成html,找了一圈,没有发现合适的应用可以把word或indd转化成干净的html.机缘巧合,无意间听说python很擅长文本处理,用Python将word文件转换成h ...
- Freemark 模板生成doc文件,xml doc文件转docx 文件,docx文件转pdf文件
freemark 模板生成doc文件,此doc文件为xml格式,无法直接转pdf 需要doc转docx文件,才能转pdf 方法1:docx4j 转 pdf 方法2: e-iceblue docx 转 ...
- 和doc的区别怎么转换手机_如何把doc文件转换成PDF格式?高手告诉你应该这么做...
视频步骤: 知乎视频www.zhihu.com 有时候老师让交的实验报告文件格式必须为PDF格式,因为PDF与不同的操作系统和软件版本具有很好的兼容性,所以大多数人都喜欢将Word转换成PDF.但有 ...
- react在线浏览doc_如何把doc文件转换成PDF格式?教你一招秒实现
有时候老师让交的实验报告文件格式必须为PDF格式,因为PDF与不同的操作系统和软件版本具有很好的兼容性,所以大多数人都喜欢将Word转换成PDF.但有的同学的Word版本不能直接将doc文件转换成PD ...
最新文章
- mysql delete删除列,在MySQL中删除我的Key列 (Delete my Key column in MySQL)
- python小技巧及速度提高-python编码时有什么技巧可以提升速度?
- linux中将hdfs数据导入hbase,将数据文件导入到HBase中
- 判断是否为gif/png图片的正确姿势
- 解决python连接mysql,UTF-8乱码问题
- 展开收起功能实现_小房间不一定要拥挤,这样设计实现小户型的大气!
- java 套接字 访问tcp_Java 网络编程(五) 使用TCP/IP的套接字(Socket)进行通信
- 机器学习基础算法33-HMM实践
- java工程师可能需要的视频
- 虚拟打印机安装后没了该怎么办
- mybatis的缓存,看这一篇就够了!
- WinRAR的注册破解
- 使用wps把word格式文件转换成pdf文件
- 计算机有很多的优点英语,电脑的优点和缺点英文作文
- 四川公办二本计算机专业院校排名,四川二本大学排名及分数线
- 在VMware WorkStation中安装Windows Server 2016
- 大学毕业4年-回顾和总结(9)-股权投资1年,给自己一个答卷(好狗狗、皇包车、职业梦、比呀比、易途8)(创业有风险,投资需谨慎)...
- 软件工程 个人学习笔记(第二章)
- html 自动 生成 日期,自己生成Select列表日期时间
- 布斯(booth)乘法详解和例子