一:python将doc文件批量转换docx:

# -*- coding:utf-8 -*-
# @Author : yyzhang
import os
import time
from win32com import clientdef doc_to_docx(list_dir,save_file):word = client.Dispatch("Word.Application")  # 打开word应用程序filename_list = [i for i in list_dir if i.split(".")[-1] == "doc"]# filename_list=[os.path.join(folder,j) for j in li ]# print(filename_list)# time.sleep(10)try:for file in filename_list:print("开始转换:",file)# print(file)# 将doc的文件名换成后缀为docx的文件name =  os.path.splitext(file)[0] + '.docx'# 将我们的docx与文件保存位置拼接起来,获得绝对路径out_name = os.path.join(save_file,name)  #print("测试后:",name)print("转换后:",out_name)# out_file.append(out_name)file_path=os.path.join(folder,file)doc = word.Documents.Open(file_path)  # 打开word文件# doc.SaveAs("{}".format(out_name), 12)  # 另存为后缀为".docx"的文件,其中参数12或16指docx文件doc.SaveAs("{}".format(out_name), 12, False, "", True, "", False,False, False,False)  # 转换后的文件,12代表转换后为docx文件doc.Close()  # 关闭原来word文件except Exception as e:print(e)word.Quit()if __name__ == "__main__":# 支持文件夹批量导入folder = 'C:\\Users\\Desktop\\DOC_docx\\doc-file'list_dir=os.listdir(folder)# print(list_dir)out_dir = 'C:\\Users\\Desktop\\DOC_docx\\doc-file1'doc_to_docx(list_dir,out_dir)

二:python将docx文件转换pdf:


import comtypes.client
import win32com
import os
import systry:from comtypes import client
except ImportError:client = Nonetry:from win32com.client import constants, gencache
except ImportError:constants = Nonegencache = Nonedef doc2pdf(docPath, pdfPath):docPathTrue = os.path.abspath(docPath)# word = gencache.EnsureDispatch('Word.Application')word = win32com.client.DispatchEx('Word.Application')doc = word.Documents.Open(docPathTrue, ReadOnly=1)doc.ExportAsFixedFormat(pdfPath,constants.wdExportFormatPDF,Item=constants.wdExportDocumentWithMarkup,CreateBookmarks=constants.wdExportCreateHeadingBookmarks)word.Quit(constants.wdDoNotSaveChanges)
doc2pdf(r"C:\Users\Desktop\DOC_docx\new_docx\语音专线协议.docx",r"C:\Users\Desktop\DOC_docx\语音专线协议.pdf")

python将doc文件转换docx相关推荐

  1. doc转docx文件会乱吗_利用python将doc文件转换为docx

    需求:最近在研究word文档的抽取,发现python中docx库只能提取以docx结尾的文件,因此需要将doc文件转换为docx. 基础知识了解 1.什么是doc? 汉语:文档(外语全称:Docume ...

  2. open一个绝对路径地址 python_实例15:用Python批量转换doc文件为docx文件

    python-docx模块虽然强大,但却不能处理后缀为".doc"的word文件.如果强制读取doc文件,将会报如下错误. import docx #导入docx库doc = do ...

  3. 使用poi根据模版生成word文档并转换成PDF文件(可处理doc文件与docx文件版)

    该篇文章是<使用poi根据模版生成word文档并转换成PDF文件>后续解决传入文件为doc文档或docx的处理方法 /*** 根据模板生成word** @param path 模板的路径* ...

  4. .doc文件转换为.docx文件

    .doc文件转换为.docx文件的python程序 #此程序调用wps来工作,如果只安装有word,则需要适当调整程序. #此程序将在待处理文件夹下新建一个名为'new'的目录,将转换后的.docx放 ...

  5. 用Python将word文件转换成html(转)

    用Python将word文件转换成html 序 最近公司一个客户大大购买了一堆医疗健康方面的科普文章,希望能放到我们正在开发的健康档案管理软件上.客户大大说,要智能推送!要掌握节奏!要深度学习!要让用 ...

  6. python word处理_妙用Python将word文件转换成html 方法超简单

    什么方法可以将word文件转换成html,找了一圈,没有发现合适的应用可以把word或indd转化成干净的html.机缘巧合,无意间听说python很擅长文本处理,用Python将word文件转换成h ...

  7. Freemark 模板生成doc文件,xml doc文件转docx 文件,docx文件转pdf文件

    freemark 模板生成doc文件,此doc文件为xml格式,无法直接转pdf 需要doc转docx文件,才能转pdf 方法1:docx4j 转 pdf 方法2: e-iceblue docx 转 ...

  8. 和doc的区别怎么转换手机_如何把doc文件转换成PDF格式?高手告诉你应该这么做...

    视频步骤: 知乎视频​www.zhihu.com 有时候老师让交的实验报告文件格式必须为PDF格式,因为PDF与不同的操作系统和软件版本具有很好的兼容性,所以大多数人都喜欢将Word转换成PDF.但有 ...

  9. react在线浏览doc_如何把doc文件转换成PDF格式?教你一招秒实现

    有时候老师让交的实验报告文件格式必须为PDF格式,因为PDF与不同的操作系统和软件版本具有很好的兼容性,所以大多数人都喜欢将Word转换成PDF.但有的同学的Word版本不能直接将doc文件转换成PD ...

最新文章

  1. mysql delete删除列,在MySQL中删除我的Key列 (Delete my Key column in MySQL)
  2. python小技巧及速度提高-python编码时有什么技巧可以提升速度?
  3. linux中将hdfs数据导入hbase,将数据文件导入到HBase中
  4. 判断是否为gif/png图片的正确姿势
  5. 解决python连接mysql,UTF-8乱码问题
  6. 展开收起功能实现_小房间不一定要拥挤,这样设计实现小户型的大气!
  7. java 套接字 访问tcp_Java 网络编程(五) 使用TCP/IP的套接字(Socket)进行通信
  8. 机器学习基础算法33-HMM实践
  9. java工程师可能需要的视频
  10. 虚拟打印机安装后没了该怎么办
  11. mybatis的缓存,看这一篇就够了!
  12. WinRAR的注册破解
  13. 使用wps把word格式文件转换成pdf文件
  14. 计算机有很多的优点英语,电脑的优点和缺点英文作文
  15. 四川公办二本计算机专业院校排名,四川二本大学排名及分数线
  16. 在VMware WorkStation中安装Windows Server 2016
  17. 大学毕业4年-回顾和总结(9)-股权投资1年,给自己一个答卷(好狗狗、皇包车、职业梦、比呀比、易途8)(创业有风险,投资需谨慎)...
  18. 软件工程 个人学习笔记(第二章)
  19. html 自动 生成 日期,自己生成Select列表日期时间
  20. 布斯(booth)乘法详解和例子

热门文章

  1. 莺尾花数据集–贝叶斯分类(day5)
  2. “下一代智能硬件Web应用防火墙”——创宇盾X完成统信互认
  3. 我要有女朋友肯定带她吃完这上面所有的小吃(很便宜哥们儿们行动起来吧)
  4. Jetson Nano系列教程3-生死看淡,不服就干之GPIO
  5. 利用代码实现山脊线、山谷线的提取(arcpy版)
  6. 2023年2月京东手机品牌销量数据查询(京东电商数据平台)
  7. 五分钟看懂python函数(同Java方法作比较)
  8. python如何自动生成表情包?
  9. Eclipse如何从官网获取历史版本
  10. 台式机设置声音快捷键