Python doc转docx
用python将Word文档中的doc格式转换成docx格式
from win32com import client as wc
from glob import glob
import osclass DocToDocx:def __init__(self, file_name):"""因为glob函数接收的是r'D:/Note/*',所以全部file_name添加/*:param file_name: 含doc文件路径"""if file_name[-1] != '*' or file_name[-1] != '/':file_name = file_name + '/*'elif file_name[-1] != '*':file_name = file_name + '*'if not os.path.exists(file_name[:-2]):raise Exception(f'{file_name}路径不存在')self.file_name = file_namedef _get_paths(self):if self.file_name is None:raise Exception(print('没有定义self.file_name'))return glob(self.file_name)def turn(self):paths = self._get_paths()w = wc.Dispatch('Word.Application') # 打开word进程for path in paths:print(path)doc = w.Documents.Open(path) # 打开doc文件doc.SaveAs(path+'x', 12) # 保存为docx,12才是docx,16是doc# doc.Close() # 别关闭,关闭了报错,原因未知w.Quit() # 关闭word进程if __name__ == '__main__':# D:\Note,该目录文件下存储doc文件d = DocToDocx(r'D:\Note')d.turn() # 开始转换
docx读取docx文件表格内容
pip install python-docx
# 打开docx文件、doc文件打开会报错
doc = docx.Document(path)
tables = doc.tables # docx文档的表格内容for i, tb in enumerate(tables): # 读取有多少表格for j, cells in enumerate(tb.rows): # 读取表格有多少行for k, cell in enumerate(cells.cells): # 表格内容print(cell.text)
Python doc转docx相关推荐
- python doc 转docx
def doc_to_docx(path_original, path_final): os.system('taskkill /im wps.exe') if os.path.splitext(pa ...
- 【script】python实现多线程将doc、docx转pdf,doc转docx
摘要 本文讲述通过python实现多线程将当前目录下的 .doc文档转.pdf..docx文档转.pdf,以及.doc文档转.docx(在python中,如需对word文档进行读写,只能读写docx格 ...
- doc转docx文件会乱吗_利用python将doc文件转换为docx
需求:最近在研究word文档的抽取,发现python中docx库只能提取以docx结尾的文件,因此需要将doc文件转换为docx. 基础知识了解 1.什么是doc? 汉语:文档(外语全称:Docume ...
- python读取 xls,xlsx,csv,doc,docx,pdf 格式的文件
前言 利用python读取 xls,xlsx,csv,doc,docx,pdf 格式的文件 python版本3.10.4 读取xls pip install xlrd==2.0.1 wps的.et文件 ...
- python实现——doc与docx互转(终极版)
目录 前言 代码 GIF演示 前言 在使用python提取所有word文件中的所有图片中提到过doc与docx互转的方法,但是代码很简单,只支持单个文件,后来优化了一下代码,现在支持某路径下的所有do ...
- python中doc转docx
最近研究怎样doc转docx,并不是单纯的改一下文件后缀,直接改后缀内核还是不一样,不便于python-docx的调用 目录 一.查看doc和docx内核 二.前置条件两个 三.代码 一.查看doc和 ...
- Python批量转换doc为docx格式
札记:对于IT从业人员会经常接触到各种文件,其中Word文档是最常见之一,它分为.doc和.docx两种格式.通过Python操作Word文档的第三方库有python-docx和pywin32,pyt ...
- python读取docx文件出错_Python:读取 .doc、.docx 两种 Word 文件简述及“Word 未能引发事件”错误...
Python 中可以读取 word 文件的库有 python-docx 和 pywin32. 优点 缺点 python-docx 跨平台 只能处理 .docx 格式,不能处理.doc格式 pywin3 ...
- Word处理控件Aspose.Words功能演示:在 Python 中将 Word DOCX 或 DOC 转换为 PDF
Word 到PDF是最流行和执行最广泛的文档转换之一.DOCX或DOC文件在打印或共享之前会转换为 PDF 格式.在本文中,我们将在 Python 中自动将 Word 转换为 PDF.步骤和代码示例将 ...
最新文章
- 先驱者? 革新者? 再谈《超级马力欧64》的设计魅力
- 07-图4 哈利·波特的考试 (25 分)
- cmd代码表白_手把手教你把Python代码转成exe
- 优秀的功能测试也可以胜任技术测试者的工资
- linux-shell面试题
- 3dmax如何显示参考图_3dmax怎么在视图中放入参照
- 网络错误0x80070005,访问被拒绝[亲测解决]
- 【VMware16的安装以及安装Linux教程(超详细上)
- 高并发下如何设计秒杀系统?
- 携程2016校园招聘笔试题分析
- 静态博客网站——vuepress功能进化
- 闲鱼曝光量突然降低是为什么呢?
- 无数据 无网络view
- Jzoj4745 看电影
- win7计算机怎么优化驱动器,Win7优化电脑加快关机速度的方法技巧
- 教你用单片机表白2019(文末送代码)
- shell脚本以服务形式被调用失败,返回127
- 手写K-Means(K均值聚类的python实现)
- python pivot() 函数
- STM8 STM8S208MB寄存器
热门文章
- Netty工作笔记0028---NIO 网络编程应用--群聊系统3--客户端编写1
- STM32工作笔记0079---UCOSIII时间片轮转调度
- 单片机工作笔记002---认识CPU的结构_哈佛结构和冯·诺依曼结构的区别
- java面试要点---Hibernate面试系统知识点复习,hibernate原理,缓冲---随时更新
- linux ftp使用相关
- 随想录(安全关键系统和rtos)
- ftk学习记(进度条篇)
- 磁盘移臂调度实验_10 Swarm 的安装和基本的服务编排调度
- c++运动学正反解 ros_ROS系统MoveIt玩转双臂机器人系列(六)–D-H逆运动学求解程序(C++)...
- 扫地机器人单扫和双扫_评测 | 千元以下的扫拖一体机器人,到底值不值得买?...