大家知道微软的office,相信doc的格式也大家耳熟能详,doc格式是微软office的word文档的早期格式,但是doc针对使用python进行批量处理时候,是有很多问题。比如:doc格式是以二进制的方式进行存储的,这样python批量解析起来就非常的麻烦。
还好,现在新版本的word是docx格式,docx格式,是以xml格式进行存储。这样就方便了python的批量处理。
以下:是将doc文档转docx的核心代码,供大家参考使用:

import os
import win32com.client as wc # doc转docx用
import time
filename = os.listdir('C:\Auto\1640069756921\') #读取“C:\Auto\1640069756921\'”目录下的doc文件
for i in range(len(filename)):
word = wc.Dispatch("WORD.Application") # 启动word进程
word.displayalerts=0 # 不警告
word.visible=0 # 不显示
doc = word.Documents.Open('C:\Auto\1640069756921\'+filename[i]) # 读取“C:\Auto\1640069756921\'”目录下的doc文件每个文件
doc.SaveAs('c:\new\'+filename[i]+'.docx',12, False, "", True, "", False, False, False, False) #在“C:\Auto\1640069756921\”目录下生成已原doc文件+docx的文件名称
doc.Close()
word.Quit()
time.sleep(3)

doc文档转docx格式,方便对文件进行批量处理【附代码】相关推荐

  1. 如何批量将 Doc 格式的 Word 文档转为 Docx 格式

    概要:我们都知道 Word 格式有多种.比如常见的有 Doc.Docx,这两种类型是能够相互兼容的,也是能够相互转化的.那今天给大家介绍的是如何将多个 Doc 格式文档批量转为 Docx 格式. 我们 ...

  2. 导出word文档生成docx格式 添加水印

    为了导出docx格式看了等多文档,最后做个总结依赖包用到dom4j和freemarker,最为方便. <!-- https://mvnrepository.com/artifact/freema ...

  3. [PYTHON]批量合并WORD文档,DOCX格式

    应用场景 某些时候按照不同的要求需要导出单个的word文档,也有可能导出整个word文档.该脚本作为[PYTHON]使用python将Oracle数据库结构导出为定制的word文档的补充,可以直接合并 ...

  4. java doc转换docx_JAVA - 将doc文档转为docx文档

    因为项目需要解析文档,而且 doc 文档还不少,全网能找到的靠谱的解析doc甚至是将doc转txt的方案实际上不多.这个是部分文件统计 .Net 和 java 有一个收费的解决方案,但是我确实没钱sp ...

  5. (Python文件处理)doc文档转UTF-8格式的TXT文档

    目录下所有doc文档转txt,本来想直接用SaveAs规定转存编码格式,但是得到的是带BOM的UTF-8格式,所以又加了个去BOM的过程. doc转txt 第一部分doc转带BOM的UTF-8参考博文 ...

  6. 利用mammoth.js将doc文档转为html

    在项目中遇到一个需求:需要将doc文档转为html格式: 最终觉得mammoth.js是非常好用的一个插件.但是目前仅支持本地资源,网络地址不能识别. <!DOCTYPE html> &l ...

  7. python办公自动化---将excel表格插入到doc文档指定位置

    应用场景: 目录 应用场景: 问题描述1 问题描述2: 小问题: 需要引入的包 总结: 要求将excel中的表格插入到word文档中 将doc格式转为docx 将表格插入文档 如有需要可以将docx文 ...

  8. Python/Django读取doc文档及在IIS8.5上部署所经历的波折及解决过程

    Tips(碰到的主要问题): doc转docx "无效的类的字符串" DCOM组件拒绝访问 NoneType has no attribute SaveAs 简要的业务过程:把Wo ...

  9. java 转换xml格式的doc或docx文档为docx以及docx转PDF

    转换xml格式的doc或docx文档为docx import org.docx4j.Docx4J; import org.docx4j.openpackaging.packages.Wordproce ...

最新文章

  1. Android系统手机端抓包方法
  2. Eclipse启动时DDMS files not found: D:\Eclipse\adt-bundle-windows-x86_64-20131030\sdk\tool
  3. oracle status
  4. BUUCTF--练习场-- basic--上传文件漏洞经典靶场upload-labs-- Pass1-3(Pass4简单尝试)
  5. Python 3 学习——函数扩展and迭代器生成器装饰器
  6. 转载:JDBC连接数据库教程,postgreSQL
  7. 沃特玛采集均衡模块_云原生在京东丨云原生时代下的监控:如何基于云原生进行指标采集?...
  8. 【论文笔记】K-plet Recurrent Neural Networks for Sequential Recommendation
  9. jquery控制span的display属性为 none
  10. linux yum安装python3_linux下yum安装python3
  11. (转)Locale 详解
  12. 几个免费的中文分词模块
  13. 把文字图片转换成文本文字
  14. 世上有不用加班的程序员吗?
  15. Clouda框架开发留言板实例
  16. 详细的苹果快捷键,赶快保存吧!
  17. 代沐研:渡尽劫波非农在,空头有望脱苦海
  18. lol计算机内存,电脑内存快满了,在玩LOL是弹出内存不足。然后清理了下内存设置了下虚拟内存后电脑出现滴咚的声音并卡机...
  19. Python requests模块详解
  20. 【安全硬件】Chap.6 IC和半导体产业的全球化;芯片生产猜疑链与SoC设计流程;可能会存在的安全威胁: 硬件木马、IP盗版、逆向工程、侧信道攻击、伪造

热门文章

  1. 【mac】nvm 的安装和使用,解决mac重启node not found,每次都得source ~/.bash_profile
  2. 0044-【宏基因组】-16S分析qiime1极简教程
  3. 一般哪些原因会造成硬盘损坏呢
  4. iOS直播实用篇(手把手教)
  5. mx250是什么_分析mx250显卡什么级别
  6. 计算机网络营销发展有哪些方面,《网络营销》(PPT124).ppt
  7. Python之自制二维码
  8. 洛谷P5804 [SEERC2019]Absolute Game
  9. OpenCV特征检测出现Unhandled exception at……Access violation reading location 0x00000000.
  10. 手把手教你做蓝牙聊天应用(三)-获取要连接的设备