doc文档转docx格式,方便对文件进行批量处理【附代码】
大家知道微软的office,相信doc的格式也大家耳熟能详,doc格式是微软office的word文档的早期格式,但是doc针对使用python进行批量处理时候,是有很多问题。比如:doc格式是以二进制的方式进行存储的,这样python批量解析起来就非常的麻烦。
还好,现在新版本的word是docx格式,docx格式,是以xml格式进行存储。这样就方便了python的批量处理。
以下:是将doc文档转docx的核心代码,供大家参考使用:
import os
import win32com.client as wc # doc转docx用
import time
filename = os.listdir('C:\Auto\1640069756921\') #读取“C:\Auto\1640069756921\'”目录下的doc文件
for i in range(len(filename)):
word = wc.Dispatch("WORD.Application") # 启动word进程
word.displayalerts=0 # 不警告
word.visible=0 # 不显示
doc = word.Documents.Open('C:\Auto\1640069756921\'+filename[i]) # 读取“C:\Auto\1640069756921\'”目录下的doc文件每个文件
doc.SaveAs('c:\new\'+filename[i]+'.docx',12, False, "", True, "", False, False, False, False) #在“C:\Auto\1640069756921\”目录下生成已原doc文件+docx的文件名称
doc.Close()
word.Quit()
time.sleep(3)
doc文档转docx格式,方便对文件进行批量处理【附代码】相关推荐
- 如何批量将 Doc 格式的 Word 文档转为 Docx 格式
概要:我们都知道 Word 格式有多种.比如常见的有 Doc.Docx,这两种类型是能够相互兼容的,也是能够相互转化的.那今天给大家介绍的是如何将多个 Doc 格式文档批量转为 Docx 格式. 我们 ...
- 导出word文档生成docx格式 添加水印
为了导出docx格式看了等多文档,最后做个总结依赖包用到dom4j和freemarker,最为方便. <!-- https://mvnrepository.com/artifact/freema ...
- [PYTHON]批量合并WORD文档,DOCX格式
应用场景 某些时候按照不同的要求需要导出单个的word文档,也有可能导出整个word文档.该脚本作为[PYTHON]使用python将Oracle数据库结构导出为定制的word文档的补充,可以直接合并 ...
- java doc转换docx_JAVA - 将doc文档转为docx文档
因为项目需要解析文档,而且 doc 文档还不少,全网能找到的靠谱的解析doc甚至是将doc转txt的方案实际上不多.这个是部分文件统计 .Net 和 java 有一个收费的解决方案,但是我确实没钱sp ...
- (Python文件处理)doc文档转UTF-8格式的TXT文档
目录下所有doc文档转txt,本来想直接用SaveAs规定转存编码格式,但是得到的是带BOM的UTF-8格式,所以又加了个去BOM的过程. doc转txt 第一部分doc转带BOM的UTF-8参考博文 ...
- 利用mammoth.js将doc文档转为html
在项目中遇到一个需求:需要将doc文档转为html格式: 最终觉得mammoth.js是非常好用的一个插件.但是目前仅支持本地资源,网络地址不能识别. <!DOCTYPE html> &l ...
- python办公自动化---将excel表格插入到doc文档指定位置
应用场景: 目录 应用场景: 问题描述1 问题描述2: 小问题: 需要引入的包 总结: 要求将excel中的表格插入到word文档中 将doc格式转为docx 将表格插入文档 如有需要可以将docx文 ...
- Python/Django读取doc文档及在IIS8.5上部署所经历的波折及解决过程
Tips(碰到的主要问题): doc转docx "无效的类的字符串" DCOM组件拒绝访问 NoneType has no attribute SaveAs 简要的业务过程:把Wo ...
- java 转换xml格式的doc或docx文档为docx以及docx转PDF
转换xml格式的doc或docx文档为docx import org.docx4j.Docx4J; import org.docx4j.openpackaging.packages.Wordproce ...
最新文章
- Android系统手机端抓包方法
- Eclipse启动时DDMS files not found: D:\Eclipse\adt-bundle-windows-x86_64-20131030\sdk\tool
- oracle status
- BUUCTF--练习场-- basic--上传文件漏洞经典靶场upload-labs-- Pass1-3(Pass4简单尝试)
- Python 3 学习——函数扩展and迭代器生成器装饰器
- 转载:JDBC连接数据库教程,postgreSQL
- 沃特玛采集均衡模块_云原生在京东丨云原生时代下的监控:如何基于云原生进行指标采集?...
- 【论文笔记】K-plet Recurrent Neural Networks for Sequential Recommendation
- jquery控制span的display属性为 none
- linux yum安装python3_linux下yum安装python3
- (转)Locale 详解
- 几个免费的中文分词模块
- 把文字图片转换成文本文字
- 世上有不用加班的程序员吗?
- Clouda框架开发留言板实例
- 详细的苹果快捷键,赶快保存吧!
- 代沐研:渡尽劫波非农在,空头有望脱苦海
- lol计算机内存,电脑内存快满了,在玩LOL是弹出内存不足。然后清理了下内存设置了下虚拟内存后电脑出现滴咚的声音并卡机...
- Python requests模块详解
- 【安全硬件】Chap.6 IC和半导体产业的全球化;芯片生产猜疑链与SoC设计流程;可能会存在的安全威胁: 硬件木马、IP盗版、逆向工程、侧信道攻击、伪造
热门文章
- 【mac】nvm 的安装和使用,解决mac重启node not found,每次都得source ~/.bash_profile
- 0044-【宏基因组】-16S分析qiime1极简教程
- 一般哪些原因会造成硬盘损坏呢
- iOS直播实用篇(手把手教)
- mx250是什么_分析mx250显卡什么级别
- 计算机网络营销发展有哪些方面,《网络营销》(PPT124).ppt
- Python之自制二维码
- 洛谷P5804 [SEERC2019]Absolute Game
- OpenCV特征检测出现Unhandled exception at……Access violation reading location 0x00000000.
- 手把手教你做蓝牙聊天应用(三)-获取要连接的设备