用python将Word文档中的doc格式转换成docx格式

from win32com import client as wc
from glob import glob
import osclass DocToDocx:def __init__(self, file_name):"""因为glob函数接收的是r'D:/Note/*',所以全部file_name添加/*:param file_name: 含doc文件路径"""if file_name[-1] != '*' or file_name[-1] != '/':file_name = file_name + '/*'elif file_name[-1] != '*':file_name = file_name + '*'if not os.path.exists(file_name[:-2]):raise Exception(f'{file_name}路径不存在')self.file_name = file_namedef _get_paths(self):if self.file_name is None:raise Exception(print('没有定义self.file_name'))return glob(self.file_name)def turn(self):paths = self._get_paths()w = wc.Dispatch('Word.Application')     # 打开word进程for path in paths:print(path)doc = w.Documents.Open(path)    # 打开doc文件doc.SaveAs(path+'x', 12)        # 保存为docx,12才是docx,16是doc# doc.Close()                   # 别关闭,关闭了报错,原因未知w.Quit()    # 关闭word进程if __name__ == '__main__':# D:\Note,该目录文件下存储doc文件d = DocToDocx(r'D:\Note')d.turn()  # 开始转换

docx读取docx文件表格内容

pip install python-docx
# 打开docx文件、doc文件打开会报错
doc = docx.Document(path)
tables = doc.tables  # docx文档的表格内容for i, tb in enumerate(tables):  # 读取有多少表格for j, cells in enumerate(tb.rows):  # 读取表格有多少行for k, cell in enumerate(cells.cells):  # 表格内容print(cell.text)

Python doc转docx相关推荐

  1. python doc 转docx

    def doc_to_docx(path_original, path_final): os.system('taskkill /im wps.exe') if os.path.splitext(pa ...

  2. 【script】python实现多线程将doc、docx转pdf,doc转docx

    摘要 本文讲述通过python实现多线程将当前目录下的 .doc文档转.pdf..docx文档转.pdf,以及.doc文档转.docx(在python中,如需对word文档进行读写,只能读写docx格 ...

  3. doc转docx文件会乱吗_利用python将doc文件转换为docx

    需求:最近在研究word文档的抽取,发现python中docx库只能提取以docx结尾的文件,因此需要将doc文件转换为docx. 基础知识了解 1.什么是doc? 汉语:文档(外语全称:Docume ...

  4. python读取 xls,xlsx,csv,doc,docx,pdf 格式的文件

    前言 利用python读取 xls,xlsx,csv,doc,docx,pdf 格式的文件 python版本3.10.4 读取xls pip install xlrd==2.0.1 wps的.et文件 ...

  5. python实现——doc与docx互转(终极版)

    目录 前言 代码 GIF演示 前言 在使用python提取所有word文件中的所有图片中提到过doc与docx互转的方法,但是代码很简单,只支持单个文件,后来优化了一下代码,现在支持某路径下的所有do ...

  6. python中doc转docx

    最近研究怎样doc转docx,并不是单纯的改一下文件后缀,直接改后缀内核还是不一样,不便于python-docx的调用 目录 一.查看doc和docx内核 二.前置条件两个 三.代码 一.查看doc和 ...

  7. Python批量转换doc为docx格式

    札记:对于IT从业人员会经常接触到各种文件,其中Word文档是最常见之一,它分为.doc和.docx两种格式.通过Python操作Word文档的第三方库有python-docx和pywin32,pyt ...

  8. python读取docx文件出错_Python:读取 .doc、.docx 两种 Word 文件简述及“Word 未能引发事件”错误...

    Python 中可以读取 word 文件的库有 python-docx 和 pywin32. 优点 缺点 python-docx 跨平台 只能处理 .docx 格式,不能处理.doc格式 pywin3 ...

  9. Word处理控件Aspose.Words功能演示:在 Python 中将 Word DOCX 或 DOC 转换为 PDF

    Word 到PDF是最流行和执行最广泛的文档转换之一.DOCX或DOC文件在打印或共享之前会转换为 PDF 格式.在本文中,我们将在 Python 中自动将 Word 转换为 PDF.步骤和代码示例将 ...

最新文章

  1. 先驱者? 革新者? 再谈《超级马力欧64》的设计魅力
  2. 07-图4 哈利·波特的考试 (25 分)
  3. cmd代码表白_手把手教你把Python代码转成exe
  4. 优秀的功能测试也可以胜任技术测试者的工资
  5. linux-shell面试题
  6. 3dmax如何显示参考图_3dmax怎么在视图中放入参照
  7. 网络错误0x80070005,访问被拒绝[亲测解决]
  8. 【VMware16的安装以及安装Linux教程(超详细上)
  9. 高并发下如何设计秒杀系统?
  10. 携程2016校园招聘笔试题分析
  11. 静态博客网站——vuepress功能进化
  12. 闲鱼曝光量突然降低是为什么呢?
  13. 无数据 无网络view
  14. Jzoj4745 看电影
  15. win7计算机怎么优化驱动器,Win7优化电脑加快关机速度的方法技巧
  16. 教你用单片机表白2019(文末送代码)
  17. shell脚本以服务形式被调用失败,返回127
  18. 手写K-Means(K均值聚类的python实现)
  19. python pivot() 函数
  20. STM8 STM8S208MB寄存器

热门文章

  1. Netty工作笔记0028---NIO 网络编程应用--群聊系统3--客户端编写1
  2. STM32工作笔记0079---UCOSIII时间片轮转调度
  3. 单片机工作笔记002---认识CPU的结构_哈佛结构和冯·诺依曼结构的区别
  4. java面试要点---Hibernate面试系统知识点复习,hibernate原理,缓冲---随时更新
  5. linux ftp使用相关
  6. 随想录(安全关键系统和rtos)
  7. ftk学习记(进度条篇)
  8. 磁盘移臂调度实验_10 Swarm 的安装和基本的服务编排调度
  9. c++运动学正反解 ros_ROS系统MoveIt玩转双臂机器人系列(六)–D-H逆运动学求解程序(C++)...
  10. 扫地机器人单扫和双扫_评测 | 千元以下的扫拖一体机器人,到底值不值得买?...